画像生成AIの情報を纏めるWikiです。

追加された行はこの色です。
削除された行はこの色です。

*PonyXLどこ?
https://civitai.com/models/257749?modelVersionId=290640

*プロンプトの書き方
Animagineと同様に独特のプロンプトルールがある。詳細は上記civitaiを参照
ケモナー御用達なのでかなり癖がある。

従来のアニメ系モデルとは全く別の思想で制作されたモデルで、いわゆる「マスピ」の概念がない。
欧米のケモノ絵、カートゥーン、ピンナップアートなどが大量に学習されているので、デフォルトでは日本人好みではない絵が出る。
日本人向けのアニメ絵を出すには以下majinaiのPony使用画像を参考にしてほしい。
https://majinai.art/ja/index.php?model=67ab2fd8ec

おそらく重要なのはポジにsource_anime,ネガにsource_pony, source_furry, source_cartoon,を入れること。
また、効きの良い絵師タグを入れると安定する。絵師タグを入れないと絵柄のばらつきが激しい。

R18絵を出したい場合、他のモデルとは異なり「nsfw」の代わりに「rating_explicit」を使うこと。といっても指定しなくても勝手に脱ぐことも多いが。
「nsfw」を入れると著しく絵の質が低下する特性がある。

公式の記載法
=|BOX|
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, just describe what you want, tag1, tag2
||=

スレで共有されたもの
=|BOX|
score_9, score_8_up, score_7_up, BREAK source_anime, rating_explicit, best quality, masterpiece, uncensored, 1girl,
||=

公式で説明されているレーティングタグ
|rating_safe|従来のsfw|
|rating_questionable|基本的に脱がない|
|rating_explicit|従来のnsfw|

**negative prompt

ケモいのやバタ臭い(洋風っぽい)のを目指さないならとりあえず入れとけ
=|BOX|
source_pony,source_furry,source_cartoon
||=

姫騎士ニキ
=|BOX|
censored, mosaic censoring, bar censor ,border, worst quality, low quality, simple background, white background, realistic, sketch ,muscle , normal quality, jpeg artifacts, depth of field, blurry, messy drawing, amateur drawing, lowres, bad anatomy, bad hands, text, error, missing fingers, fewer digits, extra digits,cropped , greyscale, monochrome, source_furry, source_pony, source_cartoon, comic ,source filmmaker,video ,3d
||=

上記を軽量化。とりあえずこの辺から始めてもいいかも
=|BOX|
low quality , bad anatomy, bad proportions, extra legs, deformed anatomy, messy color, deformed fingers, bad, distracted, hyperrealistic,source_furry, source_pony, source_cartoon
||=
----
3d, video, source filmmakerも入れるのもアリ。
https://civitai.com/models/257749?dialog=commentThread&commentId=334380
ネガのXY Plotによる比較もある。
https://civitai.com/posts/1267427

バタ臭くなりそうな作品名などを入れるのも効果がある。
''western_artist,disney,marvel,overwatch,league_of_legends,the_simpsons''があたりが定番ネガの模様。

以下は
ポジ側に source_anime, score_9,
ネガ側に source_cartoon, source_furry, source_pony
を基本とし、バタ臭くなりそうな作品を追加してみたサンプル
[[&ref(https://image02.seesaawiki.jp/n/h/nai_ch/dnVmnrLPnt-s.jpg)>https://image02.seesaawiki.jp/n/h/nai_ch/dnVmnrLPnt.jpg]]
----
ポジに score_9, score_8_up, score_7_up ネガに score_6, score_5
ポジに score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up ネガに score_4, score_5, score_6
このような書き方でクオリティが上がるとの報告もあるが、うまく調整しないと高確率でバタ臭くなるようだ。
https://civitai.com/models/257749/pony-diffusion-v6-xl?modelVersionId=290640&dialog=commentThread&commentId=343166
*推奨事項
Euler aで25ステップ。
VAEは内蔵してるので必要ない。SD1.5用のVAEを適用すると露骨に絵が崩れるので使用するならSDXL用を。
解像度は1024x1024以上(画素数が1024x1024=1048576画素前後)を強く推奨。

サンプラーにEuler aの代わりにRestartを使うと人体の精度が上がるという報告がある。
Restartはやや癖が強い。ガサガサした絵柄になりやすい感じ。
https://civitai.com/models/257749?modelVersionId=290640&dialog=commentThread&commentId=343921

プロンプトについて。Ponyでは学習元の絵につけるタグとして、e621というケモナー用danbooru系サイトのタグを使用しているようだ。
https://e621.net/wiki_pages/204(タグwiki)
これが一般的なdanbooru系列とは異なるので、danbooru系のプロンプトに反応しないようならe621のタグに置き換えてみると、もしかしたら通るかもしれない……?
(例えばdanbooru上のfutanariタグはe621ではintersexである。danbooru上のfrom belowはe621でlow-angle viewである。)

* プロンプトだけで出せるキャラ、絵師タグ
海外の有志が調べたこちらを参照
https://rentry.org/ponyxl_loras_n_stuff(通称Pony Note) ※一番下のinnate characterのセクション。
こちらのキャラリストは公式のものではないため学習されていないキャラも多く含まれているようだ。
→2024年3月19日頃、再度検証中のようだ。



**隠しトークン
一見ランダムな英数字のトークンを入力すると、それぞれ特定のイラストレーターやキャラを集中的に学習したと思われる画像が出現することが判明した。詳細は上記Pony NoteのReverse Engineered Hashed Tokensを参照のこと。
最初は3文字のトークンが発見されたが、後に3文字以外のトークンも多くあることが判明している。
望ましくないスタイルをネガティブに入れたり、あるいは良さそうなスタイルをポジティブに入れることで、より安定して好みに合った画像を出せるものと思われる。
本スレによると、ネガに隠しトークンを多数入れてもさほど効果がない、逆に思い通りの画像が出なくなったなどの報告もあるので今後の研究が期待される。
pony系の派生モデルでも本家ほどの効き具合ではないが機能する。

''aca,ces(feces=大便),gpo''は''グロテスクな画像''が重点的に学習されているようなのでネガに入れても損はないだろう。逆にこれらをポジに入れるのは禁物。
=|BOX|
0594今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ c688-yO80)
2024/03/13(水) 02:46:32.21ID:90RW5TM/0
ワイがebaraで3文字画像見ながら適当にネガ作ったらトークン数大杉になってしまった
でもとりあえず入れておくと絵柄LoRAがブレなくなって素直に使えるようになったり手ぐちゃとかの頻度が下がった気がするんやけど他の人の意見も聞いてみたい

人間やgirlが出てなかったり悪影響与えてそうなやつ
aca, aer, api, aur, bem, bif, bzi, bzl, frw, gar, gkb, gor, gpc, gpo, gvb, gzl, hnj, kzl, lbv, lwb, mjy, mtd, mwb, mwf, oir, olu, pbi, pdg, pdk, pdl, pdn, pdo, pkm, pzl, qpp, rek, rok, rzl, sbk, sid, smr, tyr, uji, vex, vml, wsp, xie, xio, yle, zac, zbi, zvu,
落書きみたいのとかアクが強かったりするやつ(こっちはなくてもいいかも 背景出にくいのを改善目的で作った)
aey, aff, aku, alp, baf, bfu, bip, bks, bku, bwf, bwu, csz, dbu, epg, evg, fbv, fey, ffs, fii, fla, gcg, gcx, gjv, grp, gsf, hag, hbz, hda, ilb, imf, ixz, kmq, kmz, kpm, kwl, kzg, lbq, lek, lpt, luz, lwl, lym, mdf, mdw, mlx, nrf, nvo, nvu, obo, ohw, oii, ojn, owz, oxz, oyz, paf, par, pjy, pme, pml, poo, pri, psm, pvo, pwl, pwn, pxg, qdc, qdl, qlt, rha, rjz, rpz, rrg, rsl, shq, sht, smg, ttp, uhf, ujf, uyf, uyz, vag, vbi, vdc, vdl, ven, vfc, wbi, wnw, wpw, xiq, xlx,
||=

**有用なトークン
トークンの大部分はケモノ系・カートゥーン系の海外アーティストに関連付けられているため有用なものは少ない。

***キャラ
|トークン|名前|
|aua|宝鐘マリン|
|lanr|星街すいせい|
|pitvinm|がうる・ぐら|

***アーティスト
|トークン|名前|備考|
|8um|ishikei||
|aze|不明||
|bfg|flou_(flou_art)|線が特徴的|
|emc|不明||
|gjem|wamudraws|デフォルメ|
|mdf|mdf_an||
|mjm|zankuro|デフォルメ|
|nviv|panken|厚塗りデフォルメ|
|qppp|sty|フラット塗り|
|pci|不明|デフォルメ|
|saz|abmayo||
|thn|xration||
|vum|bluethebone|80年代アニメ風|
* バグ
** 特定のプロンプトでノイズまみれになる
稀に黒い画像やノイズのみの画像が生成されてしまう事がある。
hakomikan氏によると、1111 WebUI側のバグらしい。特定のプロンプトの組み合わせでテンソルの値が壊れて破綻を引き起こす。
わかりやすく言うと、プロンプトの組み合わせによってはプロンプトの強度指定時にWebUIの不具合で実際の強度がおかしくなる。
https://note.com/hakomikan/n/nb6dd68a1bd9e

***解決策
WebUI 1.7以前であれば、プロンプトの語順を変えてみるか以下のExtensionを導入する。
https://github.com/hako-mikan/sd-webui-prevent-artifact
1.8以降であれば、SettingsのStable diffusionにあるEmphasis modeをNo normにする。
ただし根本的な解決策ではなく、現在でもまれにノイズ画像が発生する。

[+] 古い情報
AnimagineXL3.0と同様のバグがあるらしく、不明な条件でノイズ画像が出る。
主な対策方法は以下の通り。
・トークン数を150以下にする。
・類似した概念や部位のプロンプトの位置を離す。
・pad promptをオフにする。
[END]

* 不向きな題材
Ponyの弱点として、背景、メカ、乗り物は学習量が少ないらしく、殴り書きしたようなぼやけた仕上がりになる。
リアル画風を指定すれば背景もある程度詳細になるが、キャラがバタ臭くなるのは避けられない。
これを改善するためのLORAも公開されている。
-Pony and XL- BackgroundPack
https://civitai.com/models/478799/pony-and-xl-backgroundpack

また、服飾のバリエーションの少なさも指摘されており、ファンタジー風の派手な衣装のキャラなどは出しにくい。

ケモナーの報告によるとR18絵ではメスケモ×人間男の組み合わせとなるように強力な補正がかかるらしく、ケモノ系モデルながらケモノ同士やオスケモ×人間女の組み合わせは出しにくいらしい。
* Animagineとの連携方法
Ponyはプロンプトからの構図を生み出しが良いが、Animagineの方が絵柄が好きと言うときに、AnimagineをRefinerとして使用する方法がある。
WebUIでRefinerにチェックを入れ、Animagine(他のSDXLモデルでも可)を指定し数値を指定する。
全体のステップのうち指定した数値%まではPonyで、それ以降はAnimagineで描画することになるので、Ponyの構図を生かしてAnimagineで仕上げという処理が可能。

* 学習の注意点
学習も癖が強い。
LoRAなどの学習時のOptimizerにD-Adaptation系とProdigyを選ぶと発散しやすいので、LRを下げるかそれ以外のOptimizerの使用をおすすめする

* Controlnetとの相性
原因不明だが一部のControlnetとの相性が悪く、特にOpenposeでの指定ポーズは全く反映されない。

* 派生モデル
本スレでよく話題になる人気派生モデルを紹介する。
***3x3x3mixXL
https://civitai.com/models/464044
本家の弱点である背景表現の強化を目指したモデル。
***ebara_pony_1、ebara_pony_2.1
https://huggingface.co/tsukihara/xl_model
特にネガを指定しなくても可愛い絵柄を出せることに定評がある。
2.1は絵柄がさらに安定しているが、その分R18表現のバリエーションは弱まっている模様。
***real pony
https://civitai.com/models/365041
リアル系モデルの中でも不気味さのない顔を出せると言われている。

どなたでも編集できます

メンバー募集!