画像生成AIの情報を纏めるWikiです。

プロンプトの書き方

Animagineと同様に独特のプロンプトルールがある。詳細は上記civitaiを参照
ケモナー御用達なのでかなり癖がある。

日本人向けのアニメ絵を出すには以下majinaiのPony使用画像を参考にしてほしい。
https://majinai.art/ja/index.php?model=67ab2fd8ec

おそらく重要なのはポジにsource_anime,ネガにsource_pony, source_furry, source_cartoon,を入れること。
また、効きの良い絵師タグを入れると安定する。絵師タグを入れないと絵柄のばらつきが激しい。

R18絵を出したい場合、他のモデルとは異なり「nsfw」の代わりに「rating_explicit」を使うこと。といっても指定しなくても勝手に脱ぐことも多いが。
「nsfw」を入れると著しく絵の質が低下する特性がある。

公式の記載法
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, just describe what you want, tag1, tag2

スレで共有されたもの
score_9, score_8_up, score_7_up, BREAK source_anime, rating_explicit, best quality, masterpiece, uncensored, 1girl,

公式で説明されているレーティングタグ
rating_safe従来のsfw
rating_questionable基本的に脱がない
rating_explicit従来のnsfw

negative prompt


ケモいのやバタ臭い(洋風っぽい)のを目指さないならとりあえず入れとけ
source_pony,source_furry,source_cartoon

姫騎士ニキ
censored, mosaic censoring, bar censor ,border, worst quality, low quality, simple background, white background, realistic, sketch ,muscle , normal quality, jpeg artifacts, depth of field, blurry, messy drawing, amateur drawing, lowres, bad anatomy, bad hands, text, error, missing fingers, fewer digits, extra digits,cropped , greyscale, monochrome, source_furry, source_pony, source_cartoon, comic ,source filmmaker,video ,3d

上記を軽量化。とりあえずこの辺から始めてもいいかも
low quality , bad anatomy, bad proportions, extra legs, deformed anatomy, messy color, deformed fingers, bad, distracted, hyperrealistic,source_furry, source_pony, source_cartoon

3d, video, source filmmakerも入れるのもアリ。
https://civitai.com/models/257749?dialog=commentTh...
ネガのXY Plotによる比較もある。
https://civitai.com/posts/1267427

バタ臭くなりそうな作品名、
western artist,disney,marvelなどを入れるのも効果がある。

以下は
ポジ側に source_anime, score_9,
ネガ側に source_cartoon, source_furry, source_pony
を基本とし、バタ臭くなりそうな作品を追加してみたサンプル


ポジに score_9, score_8_up, score_7_up ネガに score_6, score_5
ポジに score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up ネガに score_4, score_5, score_6
このような書き方でクオリティが上がるとの報告もあるが、うまく調整しないと高確率でバタ臭くなるようだ。
https://civitai.com/models/257749/pony-diffusion-v...

推奨事項

Euler aで25ステップ。
VAEは内蔵してるので必要ない。SD1.5用のVAEを適用すると露骨に絵が崩れるので使用するならSDXL用を。
解像度は1024x1024以上(画素数が1024x1024=1048576画素前後)を強く推奨。

サンプラーにEuler aの代わりにRestartを使うと人体の精度が上がるという報告がある。
Restartはやや癖が強い。ガサガサした絵柄になりやすい感じ。
https://civitai.com/models/257749?modelVersionId=2...

プロンプトについて。Ponyでは学習元の絵につけるタグとして、e621というケモナー用danbooru系サイトのタグを使用しているようだ。
https://e621.net/wiki_pages/204(タグwiki)
これが一般的なdanbooru系列とは異なるので、danbooru系のプロンプトに反応しないようならe621のタグに置き換えてみると、もしかしたら通るかもしれない……?
(例えばdanbooru上のfutanariタグはe621ではintersexである。danbooru上のfrom belowはe621でlow-angle viewである。)

プロンプトだけで出せるキャラ、絵師タグ

海外の有志が調べたこちらを参照
https://rentry.org/ponyxl_loras_n_stuff(通称Pony Note) ※一番下のinnate characterのセクション。
こちらのキャラリストは公式のものではないため学習されていないキャラも多く含まれているようだ。
→2024年3月19日頃、再度検証中のようだ。


隠しトークン

一見ランダムな英数字のトークンを入力すると、それぞれ特定のイラストレーターやキャラを集中的に学習したと思われる画像が出現することが判明した。詳細は上記Pony NoteのReverse Engineered Hashed Tokensを参照のこと。
最初は3文字のトークンが発見されたが、後に3文字以外のトークンも多くあることが判明している。
望ましくないスタイルをネガティブに入れたり、あるいは良さそうなスタイルをポジティブに入れることで、より安定して好みに合った画像を出せるものと思われる。
本スレによると、ネガに隠しトークンを多数入れてもさほど効果がない、逆に思い通りの画像が出なくなったなどの報告もあるので今後の研究が期待される。

aca,ces,gpoグロテスクな画像が重点的に学習されているようなのでネガに入れても損はないだろう。逆にこれらをポジに入れるのは禁物。
0594今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ c688-yO80)
2024/03/13(水) 02:46:32.21ID:90RW5TM/0
ワイがebaraで3文字画像見ながら適当にネガ作ったらトークン数大杉になってしまった
でもとりあえず入れておくと絵柄LoRAがブレなくなって素直に使えるようになったり手ぐちゃとかの頻度が下がった気がするんやけど他の人の意見も聞いてみたい

人間やgirlが出てなかったり悪影響与えてそうなやつ
aca, aer, api, aur, bem, bif, bzi, bzl, frw, gar, gkb, gor, gpc, gpo, gvb, gzl, hnj, kzl, lbv, lwb, mjy, mtd, mwb, mwf, oir, olu, pbi, pdg, pdk, pdl, pdn, pdo, pkm, pzl, qpp, rek, rok, rzl, sbk, sid, smr, tyr, uji, vex, vml, wsp, xie, xio, yle, zac, zbi, zvu,
落書きみたいのとかアクが強かったりするやつ(こっちはなくてもいいかも 背景出にくいのを改善目的で作った)
aey, aff, aku, alp, baf, bfu, bip, bks, bku, bwf, bwu, csz, dbu, epg, evg, fbv, fey, ffs, fii, fla, gcg, gcx, gjv, grp, gsf, hag, hbz, hda, ilb, imf, ixz, kmq, kmz, kpm, kwl, kzg, lbq, lek, lpt, luz, lwl, lym, mdf, mdw, mlx, nrf, nvo, nvu, obo, ohw, oii, ojn, owz, oxz, oyz, paf, par, pjy, pme, pml, poo, pri, psm, pvo, pwl, pwn, pxg, qdc, qdl, qlt, rha, rjz, rpz, rrg, rsl, shq, sht, smg, ttp, uhf, ujf, uyf, uyz, vag, vbi, vdc, vdl, ven, vfc, wbi, wnw, wpw, xiq, xlx, 

バグ

特定のプロンプトでノイズまみれになる

稀に黒い画像やノイズのみの画像が生成されてしまう事がある。
hakomikan氏によると、1111 WebUI側のバグらしい。特定のプロンプトの組み合わせでテンソルの値が壊れて破綻を引き起こす。
わかりやすく言うと、プロンプトの組み合わせによってはプロンプトの強度指定時にWebUIの不具合で実際の強度がおかしくなる。
https://note.com/hakomikan/n/nb6dd68a1bd9e
解決策
WebUI 1.7以前であれば、プロンプトの語順を変えてみるか以下のExtensionを導入する。
https://github.com/hako-mikan/sd-webui-prevent-art...
1.8以降であれば、SettingsのStable diffusionにあるEmphasis modeをNo normにする。
ただし根本的な解決策ではなく、現在でもまれにノイズ画像が発生する。

古い情報

不向きな題材

Ponyの弱点として、背景、メカ、乗り物は学習量が少ないらしく、まともなものは期待できない。
例として「電車の車内」を描かせようとしてもよくわからない場面が出来上がる。
realisticを指定すると、背景もある程度詳細になるが、弊害としてキャラが確定でバタ臭くなる。

Animagineとの連携方法

Ponyはプロンプトからの構図を生み出しが良いが、Animagineの方が絵柄が好きと言うときに、AnimagineをRefinerとして使用する方法がある。
WebUIでRefinerにチェックを入れ、Animagine(他のSDXLモデルでも可)を指定し数値を指定する。
全体のステップのうち指定した数値%まではPonyで、それ以降はAnimagineで描画することになるので、Ponyの構図を生かしてAnimagineで仕上げという処理が可能。

学習の注意点

学習も癖が強い。
LoRAなどの学習時のOptimizerにD-Adaptation系とProdigyを選ぶと発散しやすいので、LRを下げるかそれ以外のOptimizerの使用をおすすめする

Controlnetとの相性

原因不明だが一部のControlnetとの相性が悪く、特にOpenposeでの指定ポーズは全く反映されない。

このページへのコメント

3文字トークン明らかやばいartist混じってる

2
Posted by 名無し(ID:PXAkZ3L/lw) 2024年03月17日(日) 11:14:15 返信

>3文字のトークンで特定のスタイルが学習されていることが判明した

えっ何それは(困惑)

3
Posted by 名無し(ID:z9qM9yyTYg) 2024年03月13日(水) 13:47:31 返信

体位とかは確かに良く出るんだけど癖が強すぎて使いづらい…Animagineはこれまでの延長的な感覚でいけるけどこっちは完全に別物って感じだ

0
Posted by 名無し(ID:JTDZIcm7pg) 2024年02月25日(日) 18:09:28 返信

キャラ名でいけるって書いてあるけどあんまり期待しないほうがいいね。一部キャラはいけるけど。

4
Posted by 名無し(ID:UH+qJOvmZw) 2024年02月10日(土) 04:12:12 返信

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

Prompts

  1. 非R18詠唱全文
  1. 顔(目・口・表情)
  2. 構図
  3. 場所・背景
  4. 環境表現
  5. 特徴・年齢・体型・髪型
  6. ポーズ集
  7. 服飾
  8. 亜人・モンスター娘・人外
  9. 食品
  10. その他
  11. 画風
  12. 絵文字
  13. 色一覧
  14. 頻用ネガティブプロンプト
  15. 大量検証結果
  16. 整理用倉庫

編集中メニュー

  1. 未発見のプロンプト
  2. 旧ページ

table拡張js

どなたでも編集できます

メンバー募集!