DreamBooth

概要

読解不明の謎文しかないので、今はとりあえずローカルの学習入門かとしあきDiffusionを参照することを推奨。

Dreambooth Extension for Stable-Diffusion-WebUI

2023-01-21版追記事項
DreamBoothエクステンションいれとると起動せえへん問題が発生中らしいで。
対応方法だけ抜粋すると
extensions\sd_dreambooth_extension
にある
requirements.txt
に
gradio==3.16.2
って追加してからWebUI起動してや。

詳しくは下記のissuesみてや。
https://github.com/AUTOMATIC1111/stable-diffusion-...

2023-01-12版説明
アップデートでいろいろ変わるので stable-diffusion-webui\models\dreambooth\モデル名\db_config.jsonをよく見ような
設定項目多いけど落ち着いてくそデカサンプル画像あり
とりあえず動く数値だけ
Instance Prompt について詳しく知りたい場合はこのページをくまなくよむとええで。日本語で分かりやすく説明してあってタダで見れるのはここくらいや。

一応補足やけど、このextensionのDreamBoothは他のDreamBoothツールやらと違って(？)stepとか正規化画像生成とかは「学習元1枚に対してなんぼか」で設定するから、「なんか15枚で4000ステップ学習したらええらしいで」みたいなの見かけてそのまま4000入れると合計60,000step学習しおるからよう注意やで。(この例やと合計4000stepやりたかったら4000÷15≒266step指定になるで)

学習させるモデルを選ぶ

Dreembooth タブの Input > Create タブで
名称名前を付ける
Source Checkpoint モデルを選ぶ

Create Model を押す

画像

学習の設定その1

Imput > Concepts タブで

Directories
- Dataset Directory: 学習用画像のあるディレクトリを指定する
- Classification Dataset Directory: 正則化画像のあるディレクトリを指定する
プロンプト
- Instance Prompt:
- Class Prompt:

キーワードみたいなもの。使われていない言葉がいい。例として nanU とすると設定のパターンとしては以下のようなものがある。

Instance Prompt	無し	nanU	nanU girl	nanU Unan
Class Prompt	無し	無し	girl	Unan

Image Genaration
- Class Images Per Instance Image: 0 ここも「学習元画像一枚に対しての枚数」なのであんまり巨大な数字を入れないように

画像

学習の設定その2

Input > 設定タブで

Basic

General
- Use LORA: LORAを使用する場合はオン sd-scripts (kohya)で出来るLoraとは別物(kohyaのほうが拡張版でkohya版がデファクトになってる)なんで要注意
- Generate Classification Images Using txt2img: オフ
Intervals
- Training Steps Per Image (Epochs): 100(デフォ) ここの値は対象画像一枚ごとに何Step学習するかを設定する、学習元の枚数が多いと合計が非常に多くなるので注意(例えば400を指定して学習元が20枚なら8000step合計で学習する)。

Save Model Frequency (Epochs): 適宜
Save Preview(s) Frequency (Epochs): エラーが出る場合は0

Learning Rate
- Learning Rate Scheduler: constant_with_warmup
- Learning Rate: 0.000002

Advanced

*Tuning
- Use EMA: マージモデルを使う場合オン
- Use 8bit Adam: オン
- Mixed Precision: fp16
- Memory Attention: xformers

画像

学習の設定その3

Input > Saving タブで

Generate a .ckpt file when training completes.: オン

画像

全部設定できたら
学習ボタンをクリック

とある技術部の記録

画像貼れないのでログのコピペだけ。

とある個人の雑記

ステータスの設定とかの解説はここ

学習レポート置き場

学習の流れや結果を置く場所や

パラメーター(?)などの説明

Google翻訳で
Training Stable Diffusion with Dreambooth using Diffusers https://huggingface.co/blog/dreambooth#tldr-recomm...
Dreambooth Extension for Stable-Diffusion-WebUI README.md https://github.com/d8ahazard/sd_dreambooth_extensi...

SD Dreambooth Extension についての議論(バグとか動かんとか) https://github.com/d8ahazard/sd_dreambooth_extensi...

DiffuserベースのDreamBooth (Kohya版)

Automatic1111版web UI とは別に環境つくらなあかんで CUIとGUIも別や
CUI https://github.com/kohya-ss/sd-scripts
GUI https://github.com/bmaltais/kohya_ss
日本語の説明がある https://github.com/kohya-ss/sd-scripts/blob/main/R...
https://note.com/kohya_ss/n/nba4eceaa4594

出力ファイルは last.ckpt か last.safetensors やで

環境構築とかその辺はLoraのページ読みや。

DreamBooth環境すぐ壊れてむずかしいンゴ……

予めDocker-Desktop入れとく必要あるが比較的簡単なGUIで動くやつがあるで、ただしWSL2を有効にせなあかんから、基本的には1111_WSL2を見て「Ubuntu 22.04 をセットアップ」までは済ませなあかんで。
設定周りは上記のextensionと違ってstep数が全画像の合計を指定する形(2023/1/3頃確認時点のバージョン)やったり数字の指定がちょっとちゃうから気をつけや。
あとこいつはVRAM10GB程は必要なんとSD_V2系モデルに非対応やからそこも注意せなあかん。
GUI:https://github.com/smy20011/dreambooth-gui
Docker-Desktop使いたくないんやったら同じ作者さんがDocker向けCUI版だしとるから頑張ったらええんちゃうかな？まじ知らんけど。(こっちはSD_V2系対応済みらしいで？しらんけど)
CUI版:https://github.com/smy20011/dreambooth-docker

Instance promptとInstance Tokenのどちらが呼び出しキーなのか？

正則化画像アリ学習のついでに「本当はどっちなん？」という疑問から検証してみた。ただし古いwebuiとDBでの結果です…
結論から言えば
・Existing Prompt Contentsが「Description」の場合、Instance promptに[filewords]のみなら、タグ付けテキスト内にClass Token(例:cpcにしたならcpc)が記述されていれば、Instance Tokenに入力した語(例:shs)が呼び出しキーとして機能する。
・Instance promptに[filewords]を使わない場合、Instance promptに入力した語が呼び出しキーとなる。

・検証1
1.とあるキャラA（茶髪の一般女子）の学習画像3枚（一枚絵を顔、上半身、下半身に分割）、正則化画像30枚（金髪姫騎士の絵）で学習。学習画像の名前はただの数字。同名のテキストファイルに「1girl,適当な特徴」を記述し同フォルダへ。
2.Instance promptには[filewords]、Class Promptは未入力、Instance Tokenは「shs」、Class Tokenは「1girl」、Existing Prompt Contentsは「Description」と入力し学習を行った。1e-6で600ステップ。
3.プロンプトに「1girl」で出力すると、学習元のキャラAとは似ていない絵が出る。いくつか[filewords]に記述した単語やAの特徴も入力したが結果は同じで再現性は低かった。
4.しかし「shs 1girl」で出力すると、明らかにAの特徴が強く出た。
5.今回の設定では呼び出しキーは「shs」=Instance Tokenだった。

・検証2
1.検証1との違いはタグ付けしたテキストを使用せず、Instance promptには「nanU」、Class Promptは「Unan」、Instance Tokenは「shs」、Class Tokenは「cpc」、1e-5で300ステップ。
2.1girlのみで生成するとプロンプトに特徴を記述していないにも関わらず正則化画像（金髪姫騎士）の絵が出て来た。正則化画像が学習結果に影響を与えるというのは事実らしい。Aっぽい絵も低確率で出るがほぼ姫騎士の絵が出る。これは学習率を検証1より10倍にしたせいか？
3.プロンプトにUnanやcpcでもAの絵は出ない。
4.検証1では呼び出しキーだった「shs」だとAの特徴が出始めた。しかしまだ金髪姫騎士要素も強い。shsを複数記述、強調するとAの特徴も強く出た。
5.「nanU」は上記3つのワードよりも一番Aの特徴が強く出た。今回の呼び出しキーと認識していいだろう。

・検証3
1.検証1はそもそもInstance promptは[filewords]である。Existing Prompt Contentsが「Description」の場合、[filewords]にClass Token(=1girl)が記述されていれば、語の前の位置にInstance Token(=shs)を自動で挿入してくれるらしい。それによって呼び出しキーとしてshsが機能したのかもしれない。Class Tokenを「1girl」以外にしても自動挿入してくれるのだろうか？　
2.Class Tokenは「cpc」にしてあとは検証1と同じ設定で学習。タグ付けテキスト内に「cpc」という語は無いのを確認。
3.Instance Token「shs」で生成してもキャラAとは似ていない絵が出力された。
4.今回の検証ではshsは呼び出しキーとして機能しなかった。

・疑問

検証2では「nanU」が明らかに呼び出しキーとして機能していたが、「shs」も呼び出しキーとして少し機能しているように感じた。Instance promptとInstance Tokenが異なる語の場合、Instance prompt > Instance Token という事なのだろうか？

このページを編集するこのページを元に新規ページを作成

印刷する

コメント（6）

カテゴリ：
漫画/アニメ
総合

DreamBooth - NovelAI 5ch Wiki 先頭へ

タグ

ローカル部

このページへのコメント

4GBだと学習無理なのかな……

Posted by 名無し(ID:K1M3kzCcwg) 2023年02月08日(水) 23:02:55 返信

拡張Dreamboothインストールしたけどタブが出ない……

Posted by 名無し(ID:K1M3kzCcwg) 2023年02月08日(水) 13:46:37 返信数(1) 返信

あっ、なんか出てきました

Posted by 名無し(ID:K1M3kzCcwg) 2023年02月08日(水) 19:19:51

Instance promptの件では
｢photo of ○○｣って使うやり方もあったり

Instance prompt: photo of shs woman

Class Prompt:photo of a woman

そして､このやり方[filewords]と併用することも出来たり

併用例だと

Instance Prompt:photo of shs [filewords]

Class Prompt:photo of a [filewords]

Instance Token:shs
Class Token:woman

と言う感じで

ただ､[filewords]を使う場合
タグ付けが結構重要なんで
classと一致させると良いね

タグとClassは複数指定はあんまりおすすめしない

Posted by 名無し(ID:sfrkRBi+dw) 2023年01月16日(月) 19:12:09 返信数(1) 返信

>複数指定はあんまりおすすめしない

この場合､Classに｢girl,lady,woman｣とか
タグの最初に｢girl,lady,woman｣とかね
なお､ladyはモデルにもよるけど
オバサン顔が出る率が高い

Posted by 名無し(ID:sfrkRBi+dw) 2023年01月16日(月) 19:15:27

Kohya版のDreamBoothのGUI版を起動する場合
コマンド打つのが面倒ならバッチファイルを作って置くと便利かも

メモ帳に

powershell -NoProfile -ExecutionPolicy Unrestricted .\gui.ps1

と記述して
あとはそのファイルを｢start.bat｣と言う感じの名前にして
gui.ps1と同じフォルダにでも置いおけば､
そのバッチファイルから起動出来たり

Posted by 名無し(ID:sfrkRBi+dw) 2023年01月16日(月) 08:32:13 返信

コメントをかく

名前	ユーザIDを使用しないで書き込む	ユーザーIDを使う	ログインする
備考	「http://」を含む投稿は禁止されています。
本文
利用規約をご確認のうえご記入下さい

NovelAI 5ch Wiki

概要

Dreambooth Extension for Stable-Diffusion-WebUI

学習させるモデルを選ぶ

学習の設定 その1

学習の設定 その2

Basic

Advanced

学習の設定 その3

とある技術部の記録

とある個人の雑記

学習レポート置き場

パラメーター(?)などの説明

DiffuserベースのDreamBooth (Kohya版)

DreamBooth環境すぐ壊れてむずかしいンゴ……

Instance promptとInstance Tokenのどちらが呼び出しキーなのか？

このページへのコメント

コメントをかく

Menu

はじめに

技術解説・ツール紹介

プロンプトテクニック

部活動

Prompts

R18系Prompts

ローカル部

なんJnovelAI部過去ログ

Wiki

最近更新されたスレッド

2024-07-24

2024-07-20

2024-07-17

2024-07-12

最近更新したページ

2024-07-26

2024-07-25

2024-07-24

2024-07-23

2024-07-22

2024-07-21

最新コメント