sd-scriptsに追加して使うEasy Training Scriptsの ArgsList.py の雑な日本語コメント入りバージョン
注)2024/02/24版から、設定は lora_train_command_line.py から ArgsList.py に変更されています。
以下、設定に必要な箇所(13行目から186行目)のみ記載(2023.03.29現在Ver)
設定箇所は
から
まで
class ArgStore:
def __init__(self):
# パス引数はr""を使って設定するようにしてください。そうすれば\\が不要になります。
self.base_model: str = r"" # 学習元ベースモデルのパスを指定します。例: r"E:\sd\stable-diffusion-webui\models\Stable-diffusion\nai.ckpt"
self.img_folder: str = r"" # 学習させる素材画像フォルダの場所を指定します。こちらを参照: https://rentry.org/2chAI_LoRA_Dreambooth_guide_english#for-kohyas-script
self.output_folder: str = r"" # 出力先のフォルダをここで設定します。学習途中のやつも最終結果もここに出す
self.save_json_folder: Union[str, None] = None # 設定の json フォルダーをここで設定した場所に保存します。
self.save_json_name: Union[str, None] = None
self.load_json_path: Union[str, None] = None # json ファイルをロードすると、構成が一致するように部分的に変更されます。
self.multi_run_folder: Union[str, None] = None # スクリプトによって生成された json を含むフォルダーに設定すると、それらのスクリプトを使用してトレーニングが開始されます
self.reg_img_folder: Union[str, None] = None # 正則化画像のフォルダの場所を指定します。
self.sample_prompts: Union[str, None] = None # すべてのサンプルプロンプトを含むTXTファイルへのパス、
# 1 行に 1 つ。75トークンにのみ行き、残りをカットします。プロンプトを行ごとにtxtファイルに配置するだけです
# そしてそれはそれらのプロンプトを使用して生成します
self.change_output_name: Union[str, None] = None # 作成された出力ファイル名を指定します。
self.json_load_skip_list: Union[list[str], None] = None # オプションです。ユーザーがJSONを読み込むときにスキップするものを定義できます
# 重要:デフォルトではすべてを読み込みますが
# スキップするものは次のように指定します
# [“base_model”, “img_folder”, “output_folder”]
self.training_comment: Union[str, None] = None # オプションです。アクティベーショントークンなどを入れるのに便利です。
self.save_json_only: bool = False # トレーニングをしたくない場合や、JSONを生成したいだけの場合は
# Trueに設定します。
self.tag_occurrence_txt_file: bool = True # オプションです。データセット内のすべてのタグの出現回数を記録した
# テキストファイルを作成します
# 出力チェックポイントと同じフォルダに自動的に出力されます
self.sort_tag_occurrence_alphabetically: bool = False # オプションです。
# tag_occurrence_txt_fileがtrueの場合にのみ適用されます
# 出力を出現順ではなくアルファベット順に変更します
# オプティマイザー引数
self.optimizer_type: str = "AdamW8bit" # 選択肢は AdamW, AdamW8bit, Lion, SGDNesterov,
# SGDNesterov8bit, DAdaptation, AdaFactor です
# ここでweight_decayなどのオプションを追加できます
# ここで設定された値は、AdamWやAdamW8bitを使用する場合のデフォルト値です
self.optimizer_args: Union[dict[str:str], None] = {"weight_decay": "0.1",
"betas": "0.9,0.99"} # オプティマイザーに使用できるオプション要素のリストです
# スケジューラー引数
# スケジューラーのリスト: linear, cosine, cosine_with_restarts, polynomial, constant, constant_with_warmup
self.scheduler: str = "cosine"
self.cosine_restarts: Union[int, None] = 1 # オプションです。再起動する回数を表します。
# cosine_with_restartsを使用する場合にのみ関係します
self.scheduler_power: Union[float, None] = 1 # オプションです。多項式の次数を表します。
# polynomialを使用する場合にのみ関係します
self.lr_scheduler_type: Union[str, None] = None # カスタムスケジューラーを指定するための変数
self.lr_scheduler_args: Union[dict[str:str], None] = None # カスタムスケジューラーに付随する引数
# 学習率引数
self.learning_rate: Union[float, None] = 1e-4 # AdamWはこれを必要としませんが、他のオプティマイザーは必要とする場合があります。
self.unet_lr: Union[float, None] = None # オプションです。unet用に特定のlrを設定します。
#これはAdamW内のベースlrを上書きします。
self.text_encoder_lr: Union[float, None] = None # オプションです。テキストエンコーダー用に特定のlrを設定します。
# これはAdamW内のベースlrを上書きします。
self.warmup_lr_ratio: Union[float, None] = None # オプションです。与えられた比率に基づいてウォームアップステップ数を計算します。
# constant_with_warmup を使用する場合は必ず設定してください。
# Noneで無視できます。
self.unet_only: bool = False # オプションです。unetだけをトレーニングするように設定します。
# 一般的な必須の引数
self.net_dim: int = 32 # ネットワークdim、32がデフォルトですが、高い次元でトレーニングする人もいます。
self.alpha: float = 16 # トレーニング時のスカラーを表します。デフォルトはdim の半分です。
# 古い方法でトレーニングしたい場合は、これをdimと同じに設定してください。
self.train_resolution: int = 512
self.height_resolution: Union[int, None] = None # 非スクエアな解像度でトレーニングしたい場合用
self.batch_size: int = 1 # 一度に処理される画像数であり、VRAMや解像度と直接比例します。
# VRAMが12GBで解像度が512ピクセルの場合
# 最大6バッチサイズまで可能です。
self.clip_skip: int = 2 # アニメベースのモデルでトレーニングしている場合は、
# ほとんどのモデルがそのように設計されているので、これを2にしてください
self.test_seed: int = 23 # これは「再現可能なシード」ですが、基本的にはシードをこれに設定すると、
# トレーニング画像の一つからプロンプトを入力して
# 近い表現を得ることができるはずです
self.mixed_precision: str = "fp16" # bf16を使える能力があれば、それを使ってください。それがより良いです
self.save_precision: str = "fp16" # bf16で保存することもできますが、普遍的にサポートされていないので、
# fp16で保存し続けることをお勧めします
# ネットワーク引数
self.lyco: bool = False # 新しいloconアーキテクチャを使いたい場合にオンにする
# 有効な引数は、使用するモードによって若干異なります。
# もしあなたが新しいlycoセットアップを使っているなら、conv_dim, conv_alpha, dropout, algoにアクセスできます。
# ドロップアウトは今のところloconのみですが、これを設定することで何かが壊れるということはないと思っています。
# algoはlora(loconのこと)かloha(リリースされたばかりの新しいalgo)のどちらかです。
# もしそうでなければ、Kohyaが実装しているように、conv_dimとconv_alphaにアクセスすることができます。
self.network_args: Union[dict[str:str], None] = None
# ステップ引数
self.num_epochs: int = 1 # エポック数ですが、max_stepsを設定するとこの値は無視されます。
# ステップ数は計算されません。
self.save_every_n_epochs: Union[int, None] = None # オプションです。エポックごとにどのくらい頻繁に保存するか。Noneなら無視します。
self.save_n_epoch_ratio: Union[int, None] = None # オプションです。保存するエポック数。可能な限り均等に分割したエポックを保存しようとします。
# save_every_n_epochsより優先されます
self.save_last_n_epochs: Union[int, None] = None # 最後のnエポックだけ保存する。上記の2つで上書きされます。
self.max_steps: Union[int, None] = None # オプションです。特定のステップ数を指定したい場合は、直接設定することができます。
# Noneなら無視します
# サンプル引数
# 選択するサンプラーのリスト:
# 'ddim', 'pndm', 'lms', 'euler', 'euler_a', 'heun', 'dpm_2', 'dpm_2_a', 'dpmsolver', 'dpmsolver++',
# 'dpmsingle', 'k_lms', 'k_euler', 'k_euler_a', 'k_dpm_2', 'k_dpm_2_a'
self.sample_sampler: Union[str, None] = None # トレーニング中に画像を生成するために使用するサンプラー、
# デフォルトは ddim です。
self.sample_every_n_steps: Union[int, None] = None # nステップごとにトレーニングしながらサンプル画像を生成する
self.sample_every_n_epochs: Union[int, None] = None # nエポックごとにトレーニングしながらサンプル画像を生成する,
# ステップを上書きします
# バケット引数
self.buckets: bool = True
self.min_bucket_resolution: int = 320
self.max_bucket_resolution: int = 960
self.bucket_reso_steps: Union[int, None] = None # バケット作成時に取られるステップ数です。
# 1以上の任意の正の値になります。
self.bucket_no_upscale: bool = False # バケット内の画像のアップスケーリングを無効化します。
# タグ引数
self.shuffle_captions: bool = False # オプションです。Falseなら無視します。
self.keep_tokens: Union[int, None] = None # オプションです。Noneなら無視します。
self.token_warmup_step: Union[float, None] = None # オプションです。前段階のステップ数です。
# すべてのトークンがトレーニングに使われます
self.token_warmup_min: Union[int, None] = None # オプションです。タグウォームアップで使用される最小のトークン量です。
# 他にも役に立つ引数
self.xformers: bool = True
self.cache_latents: bool = True
self.flip_aug: bool = False
self.v2: bool = False # SD2.1のトレーニングをセットアップします
self.v_parameterization: bool = False # v2も設定されていて、v2の768xバージョンを使っている場合にのみ使用されます。
self.gradient_checkpointing: bool = False # オプション:勾配チェックポイントを有効化します。
self.gradient_acc_steps: Union[int, None] = None # オプション:これが正確に何を意味するのかわかりません。
self.noise_offset: Union[float, None] = None # オプション:SDがより良い黒と白を生成できるようにするのに役立つようです
# Kohyaは、設定している場合は0.1を使うことをお勧めしますが、どれくらい
# 高い値にできるのかはわかりません。最大値は1だと仮定します。
# ノイズオフセットを使った2つのLoRAでは出力にベーキングが発生する原因となります。
self.mem_eff_attn: bool = False
# 実用的ではない無意味な引数
self.lora_model_for_resume: Union[str, None] = None # LoRAは十分に速くトレーニングできるので、これは必要ありません。
self.save_state: bool = False # LoRAは十分に速くトレーニングできるので、これは必要ありません。
self.resume: Union[str, None] = None
self.text_only: bool = False # これを使った人を見たことがありません。unet_onlyは少し使われていますが。
self.vae: Union[str, None] = None # 出力を台無しにすることが多いので、使用しないでください。
self.log_dir: Union[str, None] = None # 出力を台無しにすることが多いので、使用しないでください。
self.log_prefix: Union[str, None] = None # ログ出力にプレフィックスを追加して見つけやすくします。
self.tokenizer_cache_dir: Union[str, None] = None # Doesn't seem to help in a majority of cases
self.dataset_config: Union[str, None] = None # 私はまだjsonをtomlに変換するシステムを実装していません。
# 確実に作成し、既存のjsonファイルから変換できるようになったら、tomlをデフォルトにします
self.lowram: bool = False # colabを使っている人向けに作られたもので、私のスクリプトでは使いません。
self.no_meta: bool = False # データ保存にとって有害です。
self.color_aug: bool = False # cache latents をオフにする必要があります。
self.random_crop: bool = False # cache latents をオフにする必要があります。
self.use_8bit_adam: bool = False # 廃止されました。
self.use_lion: bool = False # 廃止されました。
self.caption_dropout_rate: Union[float, None] = None # 使われていません。
self.caption_dropout_every_n_epochs: Union[int, None] = None # 使われていません。
self.caption_tag_dropout_rate: Union[float, None] = None # 使われていません。
self.prior_loss_weight: float = 1 # この値は 1 のままにする必要があります。
self.max_grad_norm: float = 1 # この値は 1 のままにする必要があります。
self.save_as: str = "safetensors" # この値は safetensors のままにする必要があります。
self.caption_extension: str = ".txt" #.caption ファイルを使う理由がない限り、この値は .txt のままにする必要があります。
self.max_clip_token_length: Union[int, None] = 150 # txt ファイル内のプロンプトがこの値を超えることはほとんどないでしょう。
self.save_last_n_epochs_state: Union[int, None] = None # 役に立つと思われる場面はありません。
self.num_workers: int = 1 # イメージをロードするためのスレッド数です。
# 低くするとエポックの開始が速くなりますが、データのロードが遅くなります。
# ここでは、この値を減らすと訓練時間も増えると仮定しています。
self.persistent_workers: bool = True # スレッドを永続的にします。これにより、エポック間のラグも減少/消滅します。
# ただし、メモリ使用量も増える可能性があります
self.face_crop_aug_range: Union[str, None] = None
self.network_module: str = 'sd_scripts.networks.lora'
self.locon_dim: Union[int, None] = None # 廃止されました
self.locon_alpha: Union[int, None] = None # 廃止されました
self.locon: bool = False # 廃止されました