画像生成AIの情報を纏めるWikiです。

プロンプトの書き方

Animagineと同様に独特のプロンプトルールがある。詳細は上記civitaiを参照
ケモナー御用達なのでかなり癖がある。

従来のアニメ系モデルとは全く別の思想で制作されたモデルで、いわゆる「マスピ」の概念がない。
欧米のケモノ絵、カートゥーン、ピンナップアートなどが大量に学習されているので、デフォルトでは日本人好みではない絵が出る。

おそらく重要なのはポジにsource_anime,ネガにsource_pony, source_furry, source_cartoon,を入れること。
また、効きの良い絵師タグを入れると安定する。絵師タグを入れないと絵柄のばらつきが激しい。

R18絵を出したい場合、他のモデルとは異なり「nsfw」の代わりに「rating_explicit」を使うこと。といっても指定しなくても勝手に脱ぐことも多いが。
「nsfw」を入れると著しく絵の質が低下する特性がある。

公式の記載法
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, just describe what you want, tag1, tag2

スレで共有されたもの
score_9, score_8_up, score_7_up, BREAK source_anime, rating_explicit, best quality, masterpiece, uncensored, 1girl,

公式で説明されているレーティングタグ
rating_safe従来のsfw
rating_questionable基本的に脱がない
rating_explicit従来のnsfw

negative prompt


ケモいのやバタ臭い(洋風っぽい)のを目指さないならとりあえず入れとけ
source_pony,source_furry,source_cartoon

姫騎士ニキ
censored, mosaic censoring, bar censor ,border, worst quality, low quality, simple background, white background, realistic, sketch ,muscle , normal quality, jpeg artifacts, depth of field, blurry, messy drawing, amateur drawing, lowres, bad anatomy, bad hands, text, error, missing fingers, fewer digits, extra digits,cropped , greyscale, monochrome, source_furry, source_pony, source_cartoon, comic ,source filmmaker,video ,3d

上記を軽量化。とりあえずこの辺から始めてもいいかも
low quality , bad anatomy, bad proportions, extra legs, deformed anatomy, messy color, deformed fingers, bad, distracted, hyperrealistic,source_furry, source_pony, source_cartoon

3d, video, source filmmakerも入れるのもアリ。
https://civitai.com/models/257749?dialog=commentTh...
ネガのXY Plotによる比較もある。
https://civitai.com/posts/1267427

バタ臭くなりそうな作品名などを入れるのも効果がある。
western_artist,disney,marvel,overwatch,league_of_legends,the_simpsonsがあたりが定番ネガの模様。

以下は
ポジ側に source_anime, score_9,
ネガ側に source_cartoon, source_furry, source_pony
を基本とし、バタ臭くなりそうな作品を追加してみたサンプル


ポジに score_9, score_8_up, score_7_up ネガに score_6, score_5
ポジに score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up ネガに score_4, score_5, score_6
このような書き方でクオリティが上がるとの報告もあるが、うまく調整しないと高確率でバタ臭くなるようだ。
https://civitai.com/models/257749/pony-diffusion-v...

推奨事項

Euler aで25ステップ。
VAEは内蔵してるので必要ない。SD1.5用のVAEを適用すると露骨に絵が崩れるので使用するならSDXL用を。
解像度は1024x1024以上(画素数が1024x1024=1048576画素前後)を強く推奨。

サンプラーにEuler aの代わりにRestartを使うと人体の精度が上がるという報告がある。
Restartはやや癖が強い。ガサガサした絵柄になりやすい感じ。
https://civitai.com/models/257749?modelVersionId=2...

プロンプトについて。Ponyでは学習元の絵につけるタグとして、e621というケモナー用danbooru系サイトのタグを使用しているようだ。
https://e621.net/wiki_pages/204(タグwiki)
これが一般的なdanbooru系列とは異なるので、danbooru系のプロンプトに反応しないようならe621のタグに置き換えてみると、もしかしたら通るかもしれない……?
(例えばdanbooru上のfutanariタグはe621ではintersexである。danbooru上のfrom belowはe621でlow-angle viewである。)

プロンプトだけで出せるキャラ、絵師タグ

海外の有志が調べたこちらを参照
https://rentry.org/ponyxl_loras_n_stuff(通称Pony Note) ※一番下のinnate characterのセクション。
こちらのキャラリストは公式のものではないため学習されていないキャラも多く含まれているようだ。
→2024年3月19日頃、再度検証中のようだ。


隠しトークン

一見ランダムな英数字のトークンを入力すると、それぞれ特定のイラストレーターやキャラを集中的に学習したと思われる画像が出現することが判明した。詳細は上記Pony NoteのReverse Engineered Hashed Tokensを参照のこと。
最初は3文字のトークンが発見されたが、後に3文字以外のトークンも多くあることが判明している。
望ましくないスタイルをネガティブに入れたり、あるいは良さそうなスタイルをポジティブに入れることで、より安定して好みに合った画像を出せるものと思われる。
本スレによると、ネガに隠しトークンを多数入れてもさほど効果がない、逆に思い通りの画像が出なくなったなどの報告もあるので今後の研究が期待される。
pony系の派生モデルでも本家ほどの効き具合ではないが機能する。

aca,ces(feces=大便),gpoグロテスクな画像が重点的に学習されているようなのでネガに入れても損はないだろう。逆にこれらをポジに入れるのは禁物。
0594今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ c688-yO80)
2024/03/13(水) 02:46:32.21ID:90RW5TM/0
ワイがebaraで3文字画像見ながら適当にネガ作ったらトークン数大杉になってしまった
でもとりあえず入れておくと絵柄LoRAがブレなくなって素直に使えるようになったり手ぐちゃとかの頻度が下がった気がするんやけど他の人の意見も聞いてみたい

人間やgirlが出てなかったり悪影響与えてそうなやつ
aca, aer, api, aur, bem, bif, bzi, bzl, frw, gar, gkb, gor, gpc, gpo, gvb, gzl, hnj, kzl, lbv, lwb, mjy, mtd, mwb, mwf, oir, olu, pbi, pdg, pdk, pdl, pdn, pdo, pkm, pzl, qpp, rek, rok, rzl, sbk, sid, smr, tyr, uji, vex, vml, wsp, xie, xio, yle, zac, zbi, zvu,
落書きみたいのとかアクが強かったりするやつ(こっちはなくてもいいかも 背景出にくいのを改善目的で作った)
aey, aff, aku, alp, baf, bfu, bip, bks, bku, bwf, bwu, csz, dbu, epg, evg, fbv, fey, ffs, fii, fla, gcg, gcx, gjv, grp, gsf, hag, hbz, hda, ilb, imf, ixz, kmq, kmz, kpm, kwl, kzg, lbq, lek, lpt, luz, lwl, lym, mdf, mdw, mlx, nrf, nvo, nvu, obo, ohw, oii, ojn, owz, oxz, oyz, paf, par, pjy, pme, pml, poo, pri, psm, pvo, pwl, pwn, pxg, qdc, qdl, qlt, rha, rjz, rpz, rrg, rsl, shq, sht, smg, ttp, uhf, ujf, uyf, uyz, vag, vbi, vdc, vdl, ven, vfc, wbi, wnw, wpw, xiq, xlx, 

有用なトークン

トークンの大部分はケモノ系・カートゥーン系の海外アーティストに関連付けられているため有用なものは少ない。
キャラ
トークン名前
aua宝鐘マリン
lanr星街すいせい
pitvinmがうる・ぐら
アーティスト
トークン名前備考
8umishikei
aze不明
bfgflou_(flou_art)線が特徴的
emc不明
gjemwamudrawsデフォルメ
mdfmdf_an
mjmzankuroデフォルメ
nvivpanken厚塗りデフォルメ
qpppstyフラット塗り
pci不明デフォルメ
sazabmayo
thnxration
vumbluethebone80年代アニメ風

バグ

特定のプロンプトでノイズまみれになる

稀に黒い画像やノイズのみの画像が生成されてしまう事がある。
hakomikan氏によると、1111 WebUI側のバグらしい。特定のプロンプトの組み合わせでテンソルの値が壊れて破綻を引き起こす。
わかりやすく言うと、プロンプトの組み合わせによってはプロンプトの強度指定時にWebUIの不具合で実際の強度がおかしくなる。
https://note.com/hakomikan/n/nb6dd68a1bd9e
解決策
WebUI 1.7以前であれば、プロンプトの語順を変えてみるか以下のExtensionを導入する。
https://github.com/hako-mikan/sd-webui-prevent-art...
1.8以降であれば、SettingsのStable diffusionにあるEmphasis modeをNo normにする。
ただし根本的な解決策ではなく、現在でもまれにノイズ画像が発生する。

古い情報

不向きな題材

Ponyの弱点として、背景、メカ、乗り物は学習量が少ないらしく、殴り書きしたようなぼやけた仕上がりになる。
リアル画風を指定すれば背景もある程度詳細になるが、キャラがバタ臭くなるのは避けられない。
これを改善するためのLORAも公開されている。
  • Pony and XL- BackgroundPack
https://civitai.com/models/478799/pony-and-xl-back...

また、服飾のバリエーションの少なさも指摘されており、ファンタジー風の派手な衣装のキャラなどは出しにくい。

ケモナーの報告によるとR18絵ではメスケモ×人間男の組み合わせとなるように強力な補正がかかるらしく、ケモノ系モデルながらケモノ同士やオスケモ×人間女の組み合わせは出しにくいらしい。

Animagineとの連携方法

Ponyはプロンプトからの構図を生み出しが良いが、Animagineの方が絵柄が好きと言うときに、AnimagineをRefinerとして使用する方法がある。
WebUIでRefinerにチェックを入れ、Animagine(他のSDXLモデルでも可)を指定し数値を指定する。
全体のステップのうち指定した数値%まではPonyで、それ以降はAnimagineで描画することになるので、Ponyの構図を生かしてAnimagineで仕上げという処理が可能。

学習の注意点

学習も癖が強い。
LoRAなどの学習時のOptimizerにD-Adaptation系とProdigyを選ぶと発散しやすいので、LRを下げるかそれ以外のOptimizerの使用をおすすめする

Controlnetとの相性

原因不明だが一部のControlnetとの相性が悪く、特にOpenposeでの指定ポーズは全く反映されない。

派生モデル

本スレでよく話題になる人気派生モデルを紹介する。
3x3x3mixXL
https://civitai.com/models/464044
本家の弱点である背景表現の強化を目指したモデル。
ebara_pony_1、ebara_pony_2.1
https://huggingface.co/tsukihara/xl_model
特にネガを指定しなくても可愛い絵柄を出せることに定評がある。
2.1は絵柄がさらに安定しているが、その分R18表現のバリエーションは弱まっている模様。
real pony
https://civitai.com/models/365041
リアル系モデルの中でも不気味さのない顔を出せると言われている。

このページへのコメント

リアリティ寄りとかケバい寄りのトークンを雑に手当たり次第ネガに入れたら逆にデッサン崩壊しまくった
プロンプトの基本だけどなんでも盛ればいいってもんじゃないな

1
Posted by 名無し(ID:+cY0519rzg) 2024年06月02日(日) 20:05:25 返信

Prodigyやめとけて書かれてるけどむしろProdigyにして学習したら再現度がっつり上がった(´・ω・`)

1
Posted by 名無し(ID:JbrWjzp1MQ) 2024年05月08日(水) 14:18:46 返信数(1) 返信

マジで情報が錯綜しすぎててわけわからんよな
結局の所、学習したい題材によって向き不向きがあるに落ち着きそうだが…

2
Posted by 名無し(ID:HNSOKRc8ag) 2024年05月23日(木) 15:07:48

隠しトークンの[ces]はfe[ces]の略。fecesとはscatのことでウンコーである。
くわしくはttps://e621.net/wiki_pages/feces を参照のこと。外人はレインボーウンコーも模索していることに驚く。

1
Posted by 名無し(ID:UkNtPSqMXA) 2024年05月01日(水) 01:46:28 返信

3文字トークン明らかやばいartist混じってる

2
Posted by 名無し(ID:PXAkZ3L/lw) 2024年03月17日(日) 11:14:15 返信

>3文字のトークンで特定のスタイルが学習されていることが判明した

えっ何それは(困惑)

3
Posted by 名無し(ID:z9qM9yyTYg) 2024年03月13日(水) 13:47:31 返信

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

Prompts

  1. 非R18詠唱全文
  1. 顔(目・口・表情)
  2. 構図
  3. 場所・背景
  4. 環境表現
  5. 特徴・年齢・体型・髪型
  6. ポーズ集
  7. 服飾
  8. 亜人・モンスター娘・人外
  9. 食品
  10. その他
  11. 画風
  12. 絵文字
  13. 色一覧
  14. 頻用ネガティブプロンプト
  15. 大量検証結果
  16. 整理用倉庫

編集中メニュー

  1. 未発見のプロンプト
  2. 旧ページ

table拡張js

どなたでも編集できます

メンバー募集!