最終更新:ID:HG9BDBvQTA 2024年12月22日(日) 19:56:35履歴
わかんない言葉は検索しましょう。
検索しにくい略称や本スレ特有のものを中心に説明していく。
Redditだと「1111が動かないんですが」に「1111は人間ですが?」というクソリプがつく。
むかしむかしあるところに「Stable Diffusion UI」がありました。
https://github.com/cmdr2/stable-diffusion-ui
このころはGUIアプリの戦国時代で似たような名前の違うアプリが色々ありました。
NMKD Stable Diffusion GUI
https://nmkd.itch.io/t2i-gui
webuiは一般名詞だし、「Stable Diffusion UI」もGUIでWebユーザーインターフェースなので混乱しました。
実際に違うアプリを1111だと思い込んで使ってる人もいました。
そこで、混同を避けるために、NMKDはNMKDと呼ぶ慣習になり、
同様に「cmdr2版」「AUTOMATIC1111版」と呼ぶようになりました。
さらに、AUTOMATIC1111だと長いので、A1111や単に1111と呼ぶことが増えましたとさ。
シェアの差やん
cmdr2を使ってる人は全然見かけないけど、NMKDを使い続ける人はたまにいる。
1111が導入できない人とか24GBのDreamBoothが好みって人とか。
必要ならページを作って知見を集めるのも全然いいと思う。
実際にInvokeAIのページは作った。
検索しにくい略称や本スレ特有のものを中心に説明していく。
用語 | 正式名称 | 説明 |
---|---|---|
1.5 | SD 1.5 | Stable Diffusionの初代のマイナーチェンジ版。2022年にリリースされて以来長らく主流だったが、2024年からは後継のSDXLが急速に普及し廃れつつある |
AUTOMATIC1111 | 人名。でもAUTOMATIC1111氏が作ったツール「Stable Diffusion web UI」を指して呼ばれがち。 | |
A1111 | AUTOMATIC1111 | webuiと同義。人名だけどツールの名前として呼ばれがち。 |
1111 | AUTOMATIC1111 | webuiと同義。このページでも1111と表記する。 |
Animagine | Animagine XL | SDXLベースのアニメモデル |
Any | 三つの意味がある。一つ目はAnythingというモデル、二つ目はControlnet用モデルのAnytest、三つ目はLoRA学習用モデルのAnyIllustirous/Noob。 5chでAnytestと書き込むとBANされるので注意 | |
Batch count/Batch size | Batch sizeはGPUが一回の処理で画像を生成する枚数。Batch countはそれを何回行うか。カウント4、サイズ1だと1回描画を4回繰り返すから4倍の時間かかる。カウント1、サイズ4だと4枚を1度に描画するからVRAMたくさん使うけど処理が少し速い | |
Cascade | Stable Cascade | Stable Diffusionとは別系統の画像生成モデル。2024年に公開されたが、その後すぐにSD3が発表され、普及することはなかった。 |
CN | ControlNet | 専用のモデルを使用して構図を制御する仕組み。 |
Colab | Google Colaboratory | クラウドサービス。ローカル版を動かすことができる。 |
DiT | Diffusion Transformer | 生成AIのアーキテクチャの一つ。SD1,2,XLで使用されるU-Netより高性能で最近の多くの画像生成AIはこれを採用している |
DoRA | Weight-Decomposed Low-Rank Adaptation | LoRAの改良版。学習の安定性と低ランクでの性能が向上する。 |
ebara | ebara_pony | Pony Diffusionの派生モデル。配布先は消滅 |
FT | Fine-tuning | モデルのウェイトを調整する。 |
Flux | FLUX.1 | パラメータ数120億のオープンな画像生成AI。SD3と同じDiffusion Transformerを採用する。 |
GUI | sd-scriptsで学習するためのGUIを指すことが多い。GradioベースとWindows Formベースの二種類が存在する。 | |
HF/🤗 | Hugging Face | 研究者がモデルやソースコードの置き場として使っているサイト。GitHubみたいなもの。 |
Hyper-SD | Stable Diffusionの亜種で、高速サンプリング(収束が速くなる)ができるモデル | |
Illustrious/イラストリアス | Illustrious-XL | SDXLベースのアニメモデル |
i2i | img2img | Image to Image 元画像とプロンプトから画像を生成すること。 |
inpaint | i2iの1形態。元画像の一部を指定して画像を生成すること。 | |
kohya | 人名。でもツール(kohya-ss/sd-scripts)の名前として呼ばれがち。また、sd-scriptsを利用するためのbmaltais版WebUIを指すこともある。 | |
LCM | Latent Consistency Model | Stable Diffusionの亜種で、高速サンプリング(収束が速くなる)ができるモデル |
LoCon | LoRA for Convolutional Network | LoRAでは学習できていない領域(畳み込み層)まで拡張して学習するやつ。 |
LoRA | Low-Rank Adaptation | 現在主流の学習方法の1つ。 |
LR | Learning Rate | 学習率。学習のきめ細やかさあるいは速度。 |
m2m | movie to movie | 動画から動画を作る技術 |
NAI | NovelAI | 単なる略称。 |
Noob | NoobAI-XL | Illustrious-XL-v0.1の派生 |
NP/ネガ | Negative Prompt | Promptとは反対に出したくない要素を指定する |
NSFW | Not safe for work | 職場での閲覧注意。つまりえっちなやつ |
paruparu/パル/パルリアス | paruparu_illustrious | Illustrious-XLの派生。限定的に配布されている本スレ固有(?)のモデル。 |
PEFT | Parameter Efficient Fine Tuning | LoRA・LoCon・LoRA-FAその他様々な亜種のように、少ないパラメーターで全体を学習するような仕組みのこと |
pony | PonyDiffusion XL | SDXLベースのアニメ/カートゥーンモデル |
SAI | Stability AI | Stable Diffusionの開発元 |
Sana | NVIDIAなどが開発したDiTを用いた画像生成AI。軽量であることが売り。 | |
SD | Stable Diffusion | 単なる略称 |
SD2 | Stable Diffusion 2 | SD1の後継。だったがSD1からの目立った変化がなかったため流行らなかった。 |
SD3 | Stable Diffusion 3 | Stability AIが2024年2月に発表、6月にリリースされたStable Diffusionの新バージョン。SDXLを上回る性能を誇る…はずが問題だらけで流行らかなった。 |
SD3.5 | Stable Diffusion 3.5 | SD3の新バージョン。特定プロンプトで崩壊する問題などに対処し品質が向上した。 |
SD3M | Stable Diffusion 3 Medium | 数種類あるStable Diffusion 3.0のうちパラメータ数20億のもの。SD3.5 Mediumは25億。 |
SFW | Safe for work | こっちはNがついてなくて全年齢 |
t2i | txt2img | Text to Image プロンプトから画像を生成すること。 |
uc | unconditional conditioning | Negative Promptと同義 |
UC L+B | Undesired Content Low Quality + Bad Anatomy | NovelAIの定型のネガティブプロンプト。 |
V3 | NovelAI V3 | 2023年11月に登場したWeb版NovelAIの現行モデル。クローズドソース。キャラ再現度やインペイントが優秀なためローカルと併用する人も多い |
v-pred | v-prediction | ノイズ予測アルゴリズムの一つ。Zero Terminal SNRと組み合わせることで明暗に強くなる。 |
webui | Stable Diffusion web UI(AUTOMATIC1111) | SDのUIのひとつ。 |
XL | SDXL | Stability AIが2023年7月に発表した新しい画像生成モデルSDXL 1.0を指す。そのテスト版のSDXL 0.9を指す場合もあったが、こちらはほとんど使われていない |
ZTSNR | Zero Terminal SNR | SNR=0のときに完全なノイズになるよう調整することで明暗や単色背景に強くする。 |
アナル | Anlas | NovelAI公式の課金通貨。 |
リアス | Illustrious-XL | 単なる略称 |
ギップル | git pull | リモートリポジトリの変更をプル(ローカルに反映)するコマンド |
層別マージ/階層マージ/MBW | Merge Block Weighted | Merge Block Weightedで2つのモデルのU-Net層を細かく指定してマージすること。 |
ちびたい | Civitai | モデル配布サイト |
ブリーディング | bleeding | 特定の単語のプロンプトに、スペルが同じで意味の異なる単語やスペルが似た単語の概念が混入すること |
魔人/魔神 | Animagine XL | SDXLベースのアニメモデル |
マージ | Checkpoint Mergerなどで2〜3つのモデルを組み合わせること。 | |
マスピ | masterpiece | 傑作。品質向上に使われるプロンプト。切れ長のつり目、陰影の強調された顔など特徴的な絵柄になる。マスピ絵、マスピ顔とか言う。 |
ローカル版 | ほとんどの場合、自身のパソコンやクラウドサービスで動かすStable Diffusionの事を指す。かつてはNovelAI V1のリークモデルをWebUIで利用する形態を指すこともあった。 |
用語 | 正式名称 | 説明 |
---|---|---|
赤ちゃん | 初心者など難しい設定が困難である人。簡易インストーラー全般。「赤ちゃん向け」は初心者でも簡単に使用できることを意味する。由来は浦島太郎のためにを参照 | |
グチャる | 人体や構図が破綻/崩壊する。 | |
コピー機 | シード値固定や過学習などによって似たような絵を連続出力すること。由来は浦島太郎のためにを参照 | |
サンイチ | 5ちゃんねるのスレッドを立てた人に対して感謝の意を示すなんでも実況板特有のネットスラング。(AIと関係ないけど一応載せておく) | |
風船/🎈 | 排泄物を指す。閲覧注意やで(詳しくは123スレ250-) 浦島太郎のためにを参照 | |
浦島太郎 | 長期間離れてて遅れた人を指すのだが、技術革新が速すぎるので一晩で浦島太郎になったりする。 | |
ガビる | スレ内においては、出力がAI特有のノイズまみれになることを指す場合が多い。 |
用語 | 正式名称 | 説明 |
---|---|---|
Animajin/Animagagine | Animagine XL | Animagine XLの間違い |
イラストリアル | Illustrious-XL | イラストリアスの間違い。Illustrious-XLはリアルな絵を生成しない。 |
Redditだと「1111が動かないんですが」に「1111は人間ですが?」というクソリプがつく。
むかしむかしあるところに「Stable Diffusion UI」がありました。
https://github.com/cmdr2/stable-diffusion-ui
このころはGUIアプリの戦国時代で似たような名前の違うアプリが色々ありました。
NMKD Stable Diffusion GUI
https://nmkd.itch.io/t2i-gui
webuiは一般名詞だし、「Stable Diffusion UI」もGUIでWebユーザーインターフェースなので混乱しました。
実際に違うアプリを1111だと思い込んで使ってる人もいました。
そこで、混同を避けるために、NMKDはNMKDと呼ぶ慣習になり、
同様に「cmdr2版」「AUTOMATIC1111版」と呼ぶようになりました。
さらに、AUTOMATIC1111だと長いので、A1111や単に1111と呼ぶことが増えましたとさ。
シェアの差やん
cmdr2を使ってる人は全然見かけないけど、NMKDを使い続ける人はたまにいる。
1111が導入できない人とか24GBのDreamBoothが好みって人とか。
必要ならページを作って知見を集めるのも全然いいと思う。
実際にInvokeAIのページは作った。
・基本的な用語の説明頻出する用語のそれぞれの意味を説明しており、それぞれの違いなどがわかりやすい。
コメントをかく