画像生成AIの情報を纏めるWikiです。

概要

Stable Diffusion XL(以下「SDXL」と略)。
※SD1.5と異なる点が多いためとりあえず項立て。追記及び編集求む。
Stable Diffusionの新バージョン。品質が大幅に向上した。
SD1.5でろくに生成できなかった指や文字などもある程度生成できる。

ドキュメント

SDXLの動作環境


SDXL 1.0は、8GBのVRAMを搭載したコンシューマー向けGPUや、すぐに利用可能なクラウドインスタンスで問題なく動作するはずです。
SDXL 1.0 をリリースしました(公式)

SDXLの特徴

内部構造がSD1.5と違う

基本解像度が1024×1024で精細
パラメータ数が3倍になったためSD1.5よりかなり重い

誰でもわかるStable Diffusion 新バージョン「SDXL」の概要
このブログ(外部リンク)の解説記事が大変わかりやすい

SDXLのUI

編集時点で本スレで上がっているUIは下記の通り

0004今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7f7d-dc3M)
2024/01/13(土) 16:35:47.39ID:DvXS/pgj0
(略)
◼︎SDXLどうやって使うの?
webUI1111ならモデル落としていつもの場所に入れるだけ、fooocusやComfyUIも軽くて人気
(略)

AUTOMATIC 1111


0968今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7f04-Qq59)
2024/01/13(土) 16:29:32.33ID:8PpvN4mG0
もう一度貼っときますね
a1111 SDXL 低VRAM民向け3点セット
1.webui-user.batのset COMMANDLINE_ARGSに「--medvram-sdxl」を追加(低VRAM対策・高速化)
2.webui-user.batに「set PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.6, max_split_size_mb:128」を追加(OutOfMemoryError対策)
3.NVIDIAコンパネの3D設定で「CUDA - Sysmem Fall Back Policy」を「Prefer No Sysmem Fallback」にする(メモリ溢れ激遅対策)

ワイ環3060参考値
Animagine3公式サンプル:約28秒
Animagine3公式サンプルハイレゾ2倍:約2分30秒

Fooocus

https://github.com/lllyasviel/Fooocus
導入が簡単で軽い。とっつきは良いが機能性が低いため凝ったことはやりにくい。

0852今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ ff8c-SkRo)
2024/01/11(木) 05:44:07.32ID:kLv98tzD0
SDXLちょっと触りたいけどローカル使い方忘れたってやつはFooocusに乗り換えを勧めるわ
novelAI並みにユーザーインターフェースを簡素化してるからめちゃめちゃ扱いやすいしSDXLにいきなり対応してる
https://pc.watch.impress.co.jp/docs/column/nishika...

ComfyUI

https://github.com/comfyanonymous/ComfyUI
多機能で軽い。「ComfyUIでないとできない」ことが多い。やる気がある人にはComfyUIを強く推奨。本スレの上級者はほとんどComfyUIのはず(ソース無し)。

0139今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ df8e-Xueq)
2024/01/13(土) 18:32:22.34ID:pvPKwx5u0
(略)
一時の恥で聞くわ…
誰かComfyUIでfp8モード起動のやり方教えて下さい!😭💦

0145今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 7f48-4jqT)
2024/01/13(土) 18:38:58.17ID:+aLVvCTx0
>>139
python main.py --use-quad-cross-attention --fp8_e4m3fn-unet

python main.py --use-quad-cross-attention --fp8_e4m3fn-text-enc
 --use-quad-cross-attentionはなくてもおけ
 loraの効きが悪くなるのが嫌なら--force_fp16

Forge

ControlNetの作者lllyasvielによる、WebUIのリファクタリング版がリリースされた
https://github.com/lllyasviel/stable-diffusion-web...
低VRAM環境での高速化や使用メモリ削減が見込めるものの、一部Extensionがまだ動かないらしいので上記Githubを要参照
「浦島太郎のために」「2024-02-06 stable-diffusion-webui-forgeリリース」を参照。

EasySdxlWebUi

gitとかが苦手な初心者向け
https://github.com/Zuntan03/EasySdxlWebUi

EasySdxlWebUiは簡単にSDXLで画像を生成できるようにします。
ワンクリックインストーラーで古いパソコンでも動作するforge版と、実績のあるAUTOMATIC1111版(a1111)に両対応しており、簡単に使い始められます。
forgeとa1111で多くの設定を共有しており、気軽に両方を使い分けられます。
画像の生成にはインストールだけでなく、webUIの設定、拡張機能のインストールと設定、モデルなどの入手、適切なパラメータ設定などが必要になりますが、これも自動的に設定します。
中身は通常のwebUIと同一ですので、経験が後々無駄になることもありません。

287
今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった(ワッチョイ)
02/14(水) 12:55:22.69
同じPC WatchのこちらのページでEasySdxlWebUiを知ったんだが、これめちゃくちゃ便利で超絶赤ちゃん向けなのでは…?

https://pc.watch.impress.co.jp/docs/column/nishika...
PC Watchによる紹介(外部リンク)

SDXLのモデル

SDXLのモデルにはBaseとRefinerの2種類あることに注意。Refinerは任意で基本的に不要。
Animagine XL 3.0 tips
本スレでSDXLが普及する発端となったモデル

スレ民共有モデル
こちらも参照

SDXLのVAE

SD1.x/2.xとの互換性はないため注意

StabilityAI(SDXL base)のVAEはfp16ではNaN演算が発生して動かないため、No-Half VAEの有効化必須
それを修正したものがあるのでそちらの使用をおすすめする
https://huggingface.co/madebyollin/sdxl-vae-fp16-f...

Q 生成画像が灰色っぽくなります。
A 主流のSDXLモデルのほとんどはVAEを内蔵しているためVAE:Noneでいいですが、たまに内蔵されていないものがあります。
有名どころではjs2prony。その場合上記のsdxl-vae-fp16-fixを導入してVAEに指定しましょう。

js2pronyVAEなし

js2pronyVAEあり

SDXLの学習

ローカルの学習
※SDXL学習特有の問題点については編集時点で本スレで試行錯誤中
本スレの頻出質問
https://github.com/RedRayz/Kohya_lora_param_gui
Kohya_LoRA_GUI使用時のVRAM8GB対策
GUI作者からの追記:8GB用のプリセットでVRAM不足になる場合はsd-scriptsを更新してください。VRAM消費が多いバグが修正されています。

0574今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 868c-Jm4m)
2024/01/15(月) 18:08:10.63ID:vI2UfoaK0
>>573
8GB学習行けたんか?
差しつかえなければ設定教えてほしいで

0586今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ fee7-h3fU)
2024/01/15(月) 19:12:32.30ID:K9MCdvrk0
>>574
313スレ39のプリセットに8GB用あるで

0039今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ df30-Qq59)
2024/01/11(木) 10:12:37.38ID:Zvz0VIQ60
LoRA学習GUI用のサンプルプリセットにXL向けも置いてるで
https://mega.nz/folder/ILdnzaxT#gTGQmcPUgdxKlLpIl9...

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

Prompts

  1. 非R18詠唱全文
  1. 顔(目・口・表情)
  2. 構図
  3. 場所・背景
  4. 環境表現
  5. 特徴・年齢・体型・髪型
  6. ポーズ集
  7. 服飾
  8. 亜人・モンスター娘・人外
  9. 食品
  10. その他
  11. 画風
  12. 絵文字
  13. 色一覧
  14. 頻用ネガティブプロンプト
  15. 大量検証結果
  16. 整理用倉庫

編集中メニュー

  1. 未発見のプロンプト
  2. 旧ページ

table拡張js

どなたでも編集できます

メンバー募集!