画像生成AIの情報を纏めるWikiです。

×
わかんない言葉は検索しましょう。

検索しにくい略称や本スレ特有のものを中心に説明していく。

用語

ソフトウェア

用語正式名称説明
AUTOMATIC1111人名。でもAUTOMATIC1111氏が作ったツール「Stable Diffusion web UI」を指して呼ばれがち。
A1111/1111AUTOMATIC1111人名だけどツールの名前(stable-diffusion-webui)として呼ばれがち。今となってはレガシーなソフトウェア。
Easy〇〇Zuntan氏開発の、各種生成AIの環境を簡単にセットアップできるWindows専用ソフトウェア群。いわばスターターキット。
forgestable-diffusion-webui-forgestable-diffusion-webuiのフォーク(派生)。
Forge Neoforgeのフォーク。Minecraftの前提modのNeoForgeと名前が似ているが全くの別物。
GUIsd-scriptsで学習するためのGUIを指すことが多い。GradioベースとWindows Formベースの二種類が存在する。
webuiStable Diffusion web UI(AUTOMATIC1111)SDのUIのひとつ。

サービス

用語正式名称説明
ColabGoogle Colaboratoryクラウドサービス。ローカル版を動かすことができる。
HF/🤗Hugging Face研究者がモデルやソースコードの置き場として使っているサイト。GitHubみたいなもの。
NAINovelAI単なる略称。まれにNoobAI-XLの略称として使用される。
🍌Nano BananaGoogle製の画像生成AI。優れた一貫性をもつ。
アナルAnlasNovelAI公式の課金通貨。
ちびたいCivitaiモデル配布サイト
チャッピーChatGPTOepnAIが開発する大規模言語モデル(LLM)を用いたチャットボット

モデル

用語正式名称説明
FluxFLUX.1パラメータ数120億のオープンな画像生成AI。SD3と同じDiffusion Transformerを採用する。
1.5SD 1.5Stable Diffusionの初代のマイナーチェンジ版。2022年にリリースされて以来長らく主流だったが、2024年には後継のSDXLが普及しきって廃れた
Illustrious/イラストリアスIllustrious-XLSDXLベースのアニメモデル
NoobNoobAI-XLIllustrious-XL-v0.1の派生
pony7Pony Diffusion V7AuraFlowをファインチューニングしたモデル。知名度が低く情報が少ないAuraFlowがベースで流行ることは...なかった。
QwenQwen Image中国Alibabaが開発したパラメータ数20B(200億)の画像モデル
SDStable Diffusion単なる略称
V3NovelAI Diffusion V32023年11月に登場したNovelAIの旧モデル。SDXLベースだがクローズドソース。キャラ再現度やインペイントが優秀なためローカルと併用する人も多い
V4NovelAI Diffusion V4V3の後継。NovelAI独自開発でクローズドソース。U-net+T5エンコーダーらしい。
XLSDXLSDXL Base 1.0のこと
リアスIllustrious-XL単なる略称
モデルSDXLやFLUX.1などモデルアーキテクチャそのものやCheckpointを意味する。スレ内ではもっぱら後者の意味で使用される。
wanWan Video動画生成AI
LlasaTTS(Text to Speech,音声合成)のAI。LLMのLlama 3に、XCodec2というモデルに対応するデータを出力できるよう学習させたもの。
ZIT/ZIBZ Image Turbo/Z Image Base画像生成AI。Turboは蒸留版。Baseは通常版。
AnimaCosmos-Predict2ベースにTEをVAEを変更したアニメモデル

技術的

用語正式名称説明
Batch count/Batch sizeBatch sizeはGPUが一回の処理で画像を生成する枚数。Batch countはそれを何回行うか。カウント4、サイズ1だと1回描画を4回繰り返すから4倍の時間かかる。カウント1、サイズ4だと4枚を1度に描画するからVRAMたくさん使うけどCPU側の処理は一枚分だけなので少し速い
CNControlNet専用のモデルを使用して構図を制御する仕組み。
FTFine-tuningモデルのウェイトを調整する。
DiTDiffusion Transformer生成AIのアーキテクチャの一つ。SD1,2,XLで使用されるU-Netより高性能で最近の多くの画像生成AIはこれを採用している
MMDiTText EncoderにLLM(大規模言語モデル)を使用したプロンプトの解釈能力が高いDiTモデル。
gguf主に量子化モデルに使用されるフォーマット
i2iimg2imgImage to Image 元画像とプロンプトから画像を生成すること。
i2vimage to video画像から動画を生成する。
inpaintimg2imgの一形態。元画像の一部を指定して画像を生成すること。
LCMLatent Consistency Model推論(生成)の収束を速くする技術
Hyper-SD/DMD2推論(生成)の収束を速くする技術
LoRALow-Rank Adaptation現在主流の学習方法の1つ。メモリ使用量が通常のFine-tuningと比較して大幅に少ない。
LRLearning Rate学習率。学習の速度。この値が大きいと収束が速くなるが粗くなる。
m2mmovie to movie動画から動画を作る技術
NP/ネガNegative PromptPromptとは反対に出したくない要素を指定する
t2itxt2imgText to Image プロンプトから画像を生成すること。
t2vtext to videoプロンプトから動画を生成する。
ucunconditional conditioningNegative Promptと同義
v-predv-prediction parameterizationノイズ予測アルゴリズムの一つ。Zero Terminal SNRと組み合わせることで明暗に強くなる。
ZTSNR/ZSNRZero Terminal SNRSNR=0のときに完全なノイズになるよう調整することで明暗や単色背景に強くする。
マージCheckpoint Mergerなどで2〜3つのcheckpointを組み合わせる(混ぜる)こと。

その他

用語正式名称説明
Any二つの意味がある。一つ目はControlnet用モデルのAnytest、二つ目はLoRA学習用モデルのAnyIllustirous/Noob。かつてはAnythingというSD1のアニメモデルのことを指していた。
kohya人名だが、ツール(kohya-ss/sd-scripts)の名前として呼ばれがち。また、sd-scriptsを利用するためのbmaltais版WebUIを指すこともある。
SAIStability AIStable Diffusionの開発元
SFWSafe for workこっちはNがついてなくて全年齢
NSFWNot safe for work職場での閲覧注意。つまりえっちなやつ
マスピmasterpiece傑作。品質向上に使われるプロンプト。切れ長のつり目、陰影の強調された顔など特徴的な絵柄になる。マスピ絵、マスピ顔とか言う。

その他の用語

AIとは直接の関係がない本スレ固有の単語
用語正式名称説明
赤ちゃん初心者など難しい設定が困難である人。簡易インストーラー全般。「赤ちゃん向け」は初心者でも簡単に使用できることを意味する。由来は浦島太郎のためにを参照
グチャる人体や構図が破綻または崩壊する。
コピー機シード値固定や過学習などによって似たような画像を連続で出力すること。由来は浦島太郎のためにを参照
サンイチ5ちゃんねるのスレッドを立てた人に対して感謝の意を示すなんでも実況板特有のネットスラング。(AIと関係ないけど一応載せておく)
風船/🎈糞のこと。閲覧注意(詳しくは123スレ250-) 浦島太郎のためにを参照
浦島太郎長期間離れていて遅れた人を指すのだが、技術革新が速すぎるので一晩で浦島太郎になったりする。
ガビるスレッド内においては、出力がAI特有のノイズまみれになることを指す場合が多い。
ポン出しControlNetやi2iなどを使用して生成したり出力画像を編集したりせずに、そのまま利用すること。デジカメでいう「撮って出し」と同じニュアンス。
お客さんスレッドに初めて来た人のこと。「部外者」のような意味を持つ。
ギップルgit pullリモートリポジトリの変更をプル(ローカルに反映)するコマンド

よくある間違い

用語正式名称説明
Animajin/AnimagagineAnimagine XLAnimagine XLの間違い
イラストリアルIllustrious-XLイラストリアの間違い。Illustrious-XLはリアルな絵を生成しない。
v-preadv-predタイポ(誤字)
モアレ格子のような規則的な模様が重なったときに見える縞模様。しかし、スレではAI特有のノイズ、シミや靄のようなものを指す言葉として誤って使用することがある。

使用頻度の低い用語

今はほとんど使われなくなった用語です。
用語正式名称説明
DBDreambooth学習方法の1つ。LoRAの普及で廃れた。
DADreamArtist学習方法の1つ。LoRAの普及で廃れた。
HNHypernetwork学習方法の1つ。LoRAの普及で廃れた。
TITextual Inversion学習方法の1つ。LoRAの普及で廃れた。
NAIFUNovelAI AI Image Frontend UltimateNovelAI Diffusion V1のエミュレーターの一つ。
STStable Tuner学習方法の1つ。kohya系。
WDWaifu DiffusionSD1の初期に出たアニメモデル。ckptは略称で呼ばれることが多い。https://huggingface.co/を探そう。
web版NovelAIを公式サイト上で利用することを指すことが多い。SD1が主流だった頃、本家とリーク版が存在したため生まれた呼称。SD1が廃れた現在は単にNAIと呼ぶ。
お馬さんPonyDiffusion XLponyと同義。今は単にponyと呼んでいる。
金脈SD RESOURCE GOLDMINEStable Diffusionに関連するすべてのリソースとニュースを集めた総合的なサイト。1111を中心としてる。2023年から更新されておらず、SDXLが普及した今は完全に時代遅れとなっている
妖精さんSDXL以降のモデルではこの現象はほとんど発生しない。そのためSDXLが主流になった今は見かけない。1. 意図しない位置に人間(のようなもの)が描かれること。upscaleで画素数の多い絵を作ろうとすると妖精さんが湧いてくることが多い。2. wiki編集人のこと。昼寝姿が可愛いと評判。
ebaraebara_ponyPony Diffusionの派生モデル。リンク切れでDL不可。
SanaNVIDIAなどが開発したDiTを用いた画像生成AI。軽量であることが売り。だが単に研究成果を公開した感じが強く、一般利用は想定してないためか使えるUIもなく普及することはなかった(そもそもその存在を認知すらされていないような)。
PEFTParameter Efficient Fine TuningLoRA・LoCon・LoRA-FAその他様々な亜種のように、少ないパラメーターで全体を学習するような仕組みのこと
LoConLoRA for Convolutional NetworkLoRAでは学習できていない領域(畳み込み層)まで拡張して学習するやつ。
UC L+BUndesired Content Low Quality + Bad AnatomyNovelAI V1の定型のネガティブプロンプト。
CascadeStable CascadeStable Diffusionとは別系統の画像生成モデル。2024年に公開されたが、その後すぐにSD3が発表され、普及することはなかった。
SD3MStable Diffusion 3 Medium数種類あるStable Diffusion 3.0のうちパラメータ数20億のもの。SD3.5 Mediumは25億。品質が低く、批判も多かったため普及しなかった。
ponyPonyDiffusion XLSDXLベースのカートゥーンモデル。扱いやすくデータセットが大きいIllustrious系に駆逐されたり陳腐化したりで利用者も少なくなった。
SD2Stable Diffusion 2SD1の後継。だったがSD1からの目立った変化がなかったため流行らなかった。
ローカル版ほとんどの場合、自身のパソコンやクラウドサービスで動かす生成AIの事を指す。かつてはNovelAI V1のリークモデルをWebUIで利用する形態を指すこともあった。
AnimagineAnimagine XLSDXLベースのアニメモデル。V3系がSDXLの火付け役として流行った。しかし、データセットの偏りが大きく、決して良いとは言えないためその流行は長くは続かなかった。
魔人/魔神Animagine XLAnimagine XLのこと
DoRAWeight-Decomposed Low-Rank AdaptationLoRAの改良版。学習の安定性と低ランクでの性能が向上する。体感できるほどの変化がなくほとんど認知されていない。
SD3Stable Diffusion 3Stability AIが2024年2月に発表、6月にリリースされたStable Diffusionの新バージョン。SDXLを上回る性能を誇る…はずが問題だらけで流行らかなった。
SD3.5Stable Diffusion 3.5SD3の新バージョン。特定プロンプトで崩壊する問題などに対処し品質が向上した。…しかしこちらはFTが困難なためか派生モデルが全く出ず流行らなかった。しかも実質NSFW禁止になった。
層別マージ/階層マージ/MBWMerge Block WeightedMerge Block Weightedで2つのモデルのU-Net層を細かく指定してマージすること。
paruparu/パル/パルリアスparuparu_illustriousIllustrious-XLの派生。限定的に配布されている本スレ固有(?)のCheckpoint。
エビダンス由来は「亜鉛が云々→エビデンス(根拠)はあるのか→見間違いでエビンス」。スレ終盤に始まる固有のノリだったが皆飽きて廃れた模様。
ブリーディングbleeding特定の単語のプロンプトに、スペルが同じで意味の異なる単語やスペルが似た単語の概念が混入すること。SD1で多発したがSDXL以降では少ない。

スレの言葉について


基本的に雰囲気で喋ってるので細かい定義とかは気にしない文化です。

1111の表記ゆれ


Redditだと「1111が動かないんですが」に「1111は人間ですが?」というクソリプがつく。

むかしむかしあるところに「Stable Diffusion UI」がありました。
https://github.com/cmdr2/stable-diffusion-ui

このころはGUIアプリの戦国時代で似たような名前の違うアプリが色々ありました。
NMKD Stable Diffusion GUI
https://nmkd.itch.io/t2i-gui

webuiは一般名詞だし、「Stable Diffusion UI」もGUIでWebユーザーインターフェースなので混乱しました。
実際に違うアプリを1111だと思い込んで使ってる人もいました。

そこで、混同を避けるために、NMKDはNMKDと呼ぶ慣習になり、
同様に「cmdr2版」「AUTOMATIC1111版」と呼ぶようになりました。
さらに、AUTOMATIC1111だと長いので、A1111や単に1111と呼ぶことが増えましたとさ。

なぜローカル版が1111を指すのか


シェアの差やん
cmdr2やNMKDを使ってる人は全く見かけない。
必要ならページを作って知見を集めるのも全然いいと思う。
実際にInvokeAIのページは作った。
ちなみに、オリジナルの1111は開発停滞により廃れつつある。今はreForgeとComfyUIが主流。

「Web版/ローカル版」の表記ゆれ

2025年現在、独自アーキテクチャのNovelAI Diffusion V4(リーク無し)と各々が独自開発したSDXLベースモデルが普及して本家とリーク版の混同がなくなった。
そのためか、NovelAIは単にNAI、ローカルの各種UIはその名称で呼ぶようになった。

古い情報(2023年以前)

学習について

現在はLoRAが主流だが、ここでは意味の説明は書かない。それぞれの手法の詳細は個別ページを参照。

古い情報


あと「学習」「追加学習」という言葉に狭義の定義をする人もいるけど、ここでは区別していない。

「正化(Normalization)」と「正化(Regularization)」も機械学習の用語としては意味が違う。
DreamBoothのClassificationは正則化(特定の概念を忘れないようにする)。
Layer Normalizationが正規化(ベクトルの大きさを1に収める)。

層別マージ/階層マージ


まあどっちでもええやろ

外部リンク

基本的な用語の説明頻出する用語のそれぞれの意味を説明しており、それぞれの違いなどがわかりやすい。

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

table拡張js

どなたでも編集できます

広告募集中

メンバー募集!