画像生成AIの情報を纏めるWikiです。

新しいLoRAノートブックはこちら→kohya_train_network_simple

無料Colabと🤗で学習を体験してみよう的な
高いGPUが無くても頑張って768x768で学習するぞ的な
なお筆者はよくわかってない



旧バージョンはこちら→ローカルの学習入門

注意の注意


まさかの Huggingface Hubの問題で動かなくなりました。
(get-pipとの相性問題らしいけど知らん)

最新版 kohya_train_network_simple では回避済みなのでこっちは放置します。
get-pipより先にlogin()すれば大丈夫。

注意


kohyaのコードは急に動かなくなります。
(ほとんどテストしないでリリースされているものと思われる)

確実に動くバージョンを使いたいならリポジトリのハッシュを指定しましょう。
常に最新機能を追いたいなら更新のたびにオプションの見直しと動作チェックをしましょう。

検証用修正版について


Colabでは簡単にLora出来ないという誤解を払拭するために作りました。
作ってみたらエラーで止まったので誤解ではなかったことを理解しました。(直しました)
修正点
  • requirements.txtのインストールに失敗するので使わないように回避した
  • accelerate configで設定する内容をすべてコマンドラインオプションに盛り込んで警告も出ないようにした
  • learning_rate を 1e-3 (最近の推奨値)まで上げて、学習された事がわかりやすいようにした
  • xformers==0.0.16rc425をインストールする(このバージョンだと学習できないという噂がありますが動作するので確認してください)
  • モデルをDBする機能を削ってLoRA専用にしてわかりやすくした
  • 環境確認、環境構築、トレーニングとアップロードのセルを分けてエラー時にリトライしやすくした
  • caption_extensionの指定はドットを付けるのが正しいらしいので直しました
使い方
  1. 基本設定を実行(🤗にログイン) ここを変えれば他の学習も出来るはず
  2. 環境確認を実行(しなくてもいい)
  3. 環境構築を実行
  4. トレーニングとアップロードを実行 細かい設定はここで変える

学習時間は40分程度です。解像度768、batch_size=2、840Steps。
学習結果
masterpiece, best quality, 1girl, zunko <lora:Zunko-lora:1>



まあ、似てなくはない・・・かな・・・

すること

  • kohya版sd-scripts(コマンドラインツール)を実行する
  • DBでの学習(Loraにも対応可能)
  • サンプルは東北ずん子(サンプル画像は最後に掲載)

1. Googleのアカウントを作成する


Google Driveは使わないので、リークモデルとか使わないなら本垢でもたぶん大丈夫だと思うけど自己責任で。

2. Huggingfaceのアカウントを作成する


既に取得済みのを使いまわすなら名前とかメールアドレスとかが見られてもいいものか要チェック。

3. アクセストークンを追加する


使う時にコピペするので文字列の中身は気にしなくていい。

4. 学習用画像を用意する


手順4から9はサンプルを用意してあるので省略できます。
  • 解像度768x768想定
  • 「7_Zunko 1girl」フォルダを作る
  • ファイル名は任意
  • 拡張子は png
  • 枚数は24枚

5. キャプションを用意する

  • Dreambooth-LoRAの「キャプションを付ける」を参照
  • 画像ファイル名の拡張子が txt になったファイルを用意する
  • 「7_Zunko 1girl」フォルダに入れる

6. 正則化画像を用意する

  • 解像度768x768想定
  • 「1_1girl」フォルダを作る
  • ファイル名は任意
  • 拡張子は png
  • 枚数は100枚

7. 画像をzipにする

  • 「7_Zunko 1girl」フォルダごと圧縮して 7_Zunko 1girl.zip を作成する
  • 「1_1girl」フォルダごと圧縮して 1_1girl.zip を作成する
  • いずれも解凍するとフォルダが出来るようにする

8. zipを🤗にアップロードする

Datasetを作る

zipをアップロードする

  • 「Files」タブ
  • 「Add File」を押す
  • 「Upload Files」を押す
  • 2つのzipをドロップかクリックで選択
  • 「Commit changes to main」を押す
  • アップロードされたファイルの行にある「↓」を右クリックしてURLをコピーしてメモっておく

9. 学習ベースモデルのURLを用意

  • モデルをダウンロードして学習します。
  • ここから検索
  • 上記と同じ方法でモデルのURLをコピーしてメモっておく
  • なければ🤗にアップロードしましょう。

10. 学習済みモデル置き場の用意

11. Notebookを用意する


このページの冒頭にある動きそうなノートブックを開きます。

以下の手順通りに設定する。

自分のDriveにNotebookをコピーする

  • File
    • Save a copy in Drive

GPUを使う

  • Rumtime
    • Change runtime type
  • Hardware accelerator
    • GPU

12. 基本設定


用意したURLを入力します。
あらかじめ、東北ずん子のサンプルが設定してあります。
  • 「venvのURL」はそのままにしておくのがおすすめ
    • 空白にするとxformersのコンパイルを始めます(所要時間2時間弱)
  • 「モデルのアップロード先」には、手順10で作成したリポジトリを指定します
    • 例: yourname/Zunko

三角ボタンを押します。

🤗へのログインを促されるので、手順3で用意したトークンをコピペします。

13. 詳細設定


(慣れてきたら色々いじってみましょう)

ここでは解説しないので、そのまま三角ボタンを押します。

学習の実行


学習は40分程度で終わります。
アップロードも含めて1時間くらいで終わると思います。

14. 結果の確認


終わったら🤗にログインしてモデルがアップロードされていることを確認します。

モデルをダウンロードして、手元の1111などで動作確認しましょう。
masterpiece, best quality, 1girl, zunko

masterpiece, best quality, 1girl, zunko, naked

15. モデルの共有


良いモデルが出来たらURLをスレに貼ってみんなで楽しもう!
🤗にはNSFW画像は貼ってはいけないのでそういう画像はこっちで。

オプション: LoRaを作成する


  • ノートブックは検証用修正版を使いましょう。
  • 手順12までは同じ。
    • output_name をわかりやすく変更するのがおすすめ Zunko-lora など

768のbatch_sizeは5にも出来るけど時間は変わらなかった。
試しにresolutionを1024にしてみたけど動いている。

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

Prompts

  1. 非R18詠唱全文
  1. 顔(目・口・表情)
  2. 構図
  3. 場所・背景
  4. 環境表現
  5. 特徴・年齢・体型・髪型
  6. ポーズ集
  7. 服飾
  8. 亜人・モンスター娘・人外
  9. 食品
  10. その他
  11. 画風
  12. 絵文字
  13. 色一覧
  14. 頻用ネガティブプロンプト
  15. 大量検証結果
  16. 整理用倉庫

編集中メニュー

  1. 未発見のプロンプト
  2. 旧ページ

table拡張js

どなたでも編集できます

メンバー募集!