画像生成AIの情報を纏めるWikiです。

×
わかんない言葉は検索しましょう。

検索しにくい略称や本スレ特有のものを中心に説明していく。
用語正式名称説明
1.5SD 1.5Stable Diffusionの初代のマイナーチェンジ版。2022年にリリースされて以来長らく主流だったが、2024年からは後継のSDXLが急速に普及し廃れつつある
AUTOMATIC1111人名。でもAUTOMATIC1111氏が作ったツール「Stable Diffusion web UI」を指して呼ばれがち。
A1111AUTOMATIC1111webuiと同義。人名だけどツールの名前として呼ばれがち。
1111AUTOMATIC1111webuiと同義。このページでも1111と表記する。
AnimagineAnimagine XLSDXLベースのアニメモデル
Any三つの意味がある。一つ目はAnythingというモデル、二つ目はControlnet用モデルのAnytest、三つ目はLoRA学習用モデルのAnyIllustirous/Noob。
5chでAnytestと書き込むとBANされるので注意
Batch count/Batch sizeBatch sizeはGPUが一回の処理で画像を生成する枚数。Batch countはそれを何回行うか。カウント4、サイズ1だと1回描画を4回繰り返すから4倍の時間かかる。カウント1、サイズ4だと4枚を1度に描画するからVRAMたくさん使うけど処理が少し速い
CascadeStable CascadeStable Diffusionとは別系統の画像生成モデル。2024年に公開されたが、その後すぐにSD3が発表され、普及することはなかった。
CNControlNet専用のモデルを使用して構図を制御する仕組み。
ColabGoogle Colaboratoryクラウドサービス。ローカル版を動かすことができる。
DiTDiffusion Transformer生成AIのアーキテクチャの一つ。SD1,2,XLで使用されるU-Netより高性能で最近の多くの画像生成AIはこれを採用している
DoRAWeight-Decomposed Low-Rank AdaptationLoRAの改良版。学習の安定性と低ランクでの性能が向上する。
ebaraebara_ponyPony Diffusionの派生モデル。配布先は消滅
FTFine-tuningモデルのウェイトを調整する。
FluxFLUX.1パラメータ数120億のオープンな画像生成AI。SD3と同じDiffusion Transformerを採用する。
GUIsd-scriptsで学習するためのGUIを指すことが多い。GradioベースとWindows Formベースの二種類が存在する。
HF/🤗Hugging Face研究者がモデルやソースコードの置き場として使っているサイト。GitHubみたいなもの。
Hyper-SDStable Diffusionの亜種で、高速サンプリング(収束が速くなる)ができるモデル
Illustrious/イラストリアスIllustrious-XLSDXLベースのアニメモデル
i2iimg2imgImage to Image 元画像とプロンプトから画像を生成すること。
inpainti2iの1形態。元画像の一部を指定して画像を生成すること。
kohya人名。でもツール(kohya-ss/sd-scripts)の名前として呼ばれがち。また、sd-scriptsを利用するためのbmaltais版WebUIを指すこともある。
LCMLatent Consistency ModelStable Diffusionの亜種で、高速サンプリング(収束が速くなる)ができるモデル
LoConLoRA for Convolutional NetworkLoRAでは学習できていない領域(畳み込み層)まで拡張して学習するやつ。
LoRALow-Rank Adaptation現在主流の学習方法の1つ。
LRLearning Rate学習率。学習のきめ細やかさあるいは速度。
m2mmovie to movie動画から動画を作る技術
NAINovelAI単なる略称。
NoobNoobAI-XLIllustrious-XL-v0.1の派生
NP/ネガNegative PromptPromptとは反対に出したくない要素を指定する
NSFWNot safe for work職場での閲覧注意。つまりえっちなやつ
paruparu/パル/パルリアスparuparu_illustriousIllustrious-XLの派生。限定的に配布されている本スレ固有(?)のモデル。
PEFTParameter Efficient Fine TuningLoRA・LoCon・LoRA-FAその他様々な亜種のように、少ないパラメーターで全体を学習するような仕組みのこと
ponyPonyDiffusion XLSDXLベースのアニメ/カートゥーンモデル
SAIStability AIStable Diffusionの開発元
SanaNVIDIAなどが開発したDiTを用いた画像生成AI。軽量であることが売り。
SDStable Diffusion単なる略称
SD2Stable Diffusion 2SD1の後継。だったがSD1からの目立った変化がなかったため流行らなかった。
SD3Stable Diffusion 3Stability AIが2024年2月に発表、6月にリリースされたStable Diffusionの新バージョン。SDXLを上回る性能を誇る…はずが問題だらけで流行らかなった。
SD3.5Stable Diffusion 3.5SD3の新バージョン。特定プロンプトで崩壊する問題などに対処し品質が向上した。
SD3MStable Diffusion 3 Medium数種類あるStable Diffusion 3.0のうちパラメータ数20億のもの。SD3.5 Mediumは25億。
SFWSafe for workこっちはNがついてなくて全年齢
t2itxt2imgText to Image プロンプトから画像を生成すること。
ucunconditional conditioningNegative Promptと同義
UC L+BUndesired Content Low Quality + Bad AnatomyNovelAIの定型のネガティブプロンプト。
V3NovelAI V32023年11月に登場したWeb版NovelAIの現行モデル。クローズドソース。キャラ再現度やインペイントが優秀なためローカルと併用する人も多い
v-predv-predictionノイズ予測アルゴリズムの一つ。Zero Terminal SNRと組み合わせることで明暗に強くなる。
webuiStable Diffusion web UI(AUTOMATIC1111)SDのUIのひとつ。
XLSDXLStability AIが2023年7月に発表した新しい画像生成モデルSDXL 1.0を指す。そのテスト版のSDXL 0.9を指す場合もあったが、こちらはほとんど使われていない
ZTSNRZero Terminal SNRSNR=0のときに完全なノイズになるよう調整することで明暗や単色背景に強くする。
アナルAnlasNovelAI公式の課金通貨。
リアスIllustrious-XL単なる略称
ギップルgit pullリモートリポジトリの変更をプル(ローカルに反映)するコマンド
層別マージ/階層マージ/MBWMerge Block WeightedMerge Block Weightedで2つのモデルのU-Net層を細かく指定してマージすること。
ちびたいCivitaiモデル配布サイト
ブリーディングbleeding特定の単語のプロンプトに、スペルが同じで意味の異なる単語やスペルが似た単語の概念が混入すること
魔人/魔神Animagine XLSDXLベースのアニメモデル
マージCheckpoint Mergerなどで2〜3つのモデルを組み合わせること。
マスピmasterpiece傑作。品質向上に使われるプロンプト。切れ長のつり目、陰影の強調された顔など特徴的な絵柄になる。マスピ絵、マスピ顔とか言う。
ローカル版ほとんどの場合、自身のパソコンやクラウドサービスで動かすStable Diffusionの事を指す。かつてはNovelAI V1のリークモデルをWebUIで利用する形態を指すこともあった。

その他の用語

用語正式名称説明
赤ちゃん初心者など難しい設定が困難である人。簡易インストーラー全般。「赤ちゃん向け」は初心者でも簡単に使用できることを意味する。由来は浦島太郎のためにを参照
グチャる人体や構図が破綻/崩壊する。
コピー機シード値固定や過学習などによって似たような絵を連続出力すること。由来は浦島太郎のためにを参照
サンイチ5ちゃんねるのスレッドを立てた人に対して感謝の意を示すなんでも実況板特有のネットスラング。(AIと関係ないけど一応載せておく)
風船/🎈排泄物を指す。閲覧注意やで(詳しくは123スレ250-) 浦島太郎のためにを参照
浦島太郎長期間離れてて遅れた人を指すのだが、技術革新が速すぎるので一晩で浦島太郎になったりする。
ガビるスレ内においては、出力がAI特有のノイズまみれになることを指す場合が多い。

よくある間違い

用語正式名称説明
Animajin/AnimagagineAnimagine XLAnimagine XLの間違い
イラストリアルIllustrious-XLイラストリアの間違い。Illustrious-XLはリアルな絵を生成しない。

古い用語

スレの言葉について


基本的に雰囲気で喋ってるので細かい定義とかは気にしない文化です。

1111の表記ゆれ


Redditだと「1111が動かないんですが」に「1111は人間ですが?」というクソリプがつく。

むかしむかしあるところに「Stable Diffusion UI」がありました。
https://github.com/cmdr2/stable-diffusion-ui

このころはGUIアプリの戦国時代で似たような名前の違うアプリが色々ありました。
NMKD Stable Diffusion GUI
https://nmkd.itch.io/t2i-gui

webuiは一般名詞だし、「Stable Diffusion UI」もGUIでWebユーザーインターフェースなので混乱しました。
実際に違うアプリを1111だと思い込んで使ってる人もいました。

そこで、混同を避けるために、NMKDはNMKDと呼ぶ慣習になり、
同様に「cmdr2版」「AUTOMATIC1111版」と呼ぶようになりました。
さらに、AUTOMATIC1111だと長いので、A1111や単に1111と呼ぶことが増えましたとさ。

なぜローカル版が1111を指すのか


シェアの差やん
cmdr2を使ってる人は全然見かけないけど、NMKDを使い続ける人はたまにいる。
1111が導入できない人とか24GBのDreamBoothが好みって人とか。
必要ならページを作って知見を集めるのも全然いいと思う。
実際にInvokeAIのページは作った。

「Web版/ローカル版」の表記ゆれ

2024年現在、SDXLベースのNovelAI V3(リーク無し)と各々が独自開発したSDXLベースモデルが普及して本家とリーク版の混同がなくなった。
そのためか、NovelAIは単にNAI、ローカルの各種UIはその名称で呼ぶようになった。

古い情報

学習について

現在はLoRAが主流だが、ここでは意味の説明は書かない。それぞれの手法の詳細は個別ページを参照。

古い情報


あと「学習」「追加学習」という言葉に狭義の定義をする人もいるけど、ここでは区別していない。

「正化(Normalization)」と「正化(Regularization)」も機械学習の用語としては意味が違う。
DreamBoothのClassificationは正則化(特定の概念を忘れないようにする)。
Layer Normalizationが正規化(ベクトルの大きさを1に収める)。

層別マージ/階層マージ


まあどっちでもええやろ

外部リンク

基本的な用語の説明頻出する用語のそれぞれの意味を説明しており、それぞれの違いなどがわかりやすい。

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

table拡張js

どなたでも編集できます

メンバー募集!