ControlNet

ControlNetについて

ポーズや構図等を指定して画像生成できるようにする拡張機能。
従来のプロンプトでの画像制御に加えて、輪郭線・奥行き・人のポーズなどの「画像情報」を追加で入力することで、より思い通りに画像を制御できる。
その制御方法（Model）は複数ある（詳しくはcannyやhedやsegなど、下記参照）。

詳細

i2iとの違い

インストール

Stable Diffusion Web UI の「拡張機能 (Extensions)」タブ > 「URLからインストール (Install from URL)」に、以下のURLを入れてインストールします。
https://github.com/Mikubill/sd-webui-controlnet
以下からモデルファイル（.safetensorsファイルもしくは.pth）をダウンロードして「stable-diffusion-webui\extensions\sd-webui-controlnet\models」に置きます。

標準的な軽量モデル：https://huggingface.co/webui/ControlNet-modules-sa...
kohya氏によるモデル改良版（何か応答がよくなるらしい？）：https://huggingface.co/kohya-ss/ControlNet-diff-mo...
有志の人が作った顔の向きや目や口の状態がわかるControlNetMediaPipeFace: https://huggingface.co/CrucibleAI/ControlNetMediaP...
2023年4月中旬ごろに発表されたControlNet 1.1: https://huggingface.co/lllyasviel/ControlNet-v1-1/...

使い方

txt2img・img2imgタブの下にControlNetができてるので▼をクリック

Enableを押して
Preprocessor を選んで
Preprocessor と同じ名前のモデルを選ぶ

詳しい例は上のやつ読んで

Preprocessorの種類と特徴

名前	説明	元画像	プリプロセッサ処理後画像	出力画像
canny	輪郭線を検出して取り出す
depth	深度情報を引き継ぐ立体的な位置関係を処理できる
hed	いわゆる「描き込み」的な部分を取り出すタッチを引き継ぎやすい
mlsd	直線の輪郭だけ取り出す曲線のない人工的な構図をノイズ無く取り出せる
normal_map	法線情報を引き継ぐ　深度情報よりも細部の立体感に沿いやすい
openpose	おなじみの棒人間
openpose_hand	棒人間に手が追加されたやつ．現状あまり認識精度が良くない印象．
openpose_face	棒人間に顔の特徴点(face landmarks)が追加されたもの(v1.1追加)．棒人間では表現しきれなかった目や口の状態や顔の大きさなどが表現できるようになった
openpose_full	openpose+openpose_hand+openpose_faceの処理すべてを行う(v1.1追加)．
mediapipe_face	ControlNetの発案者とは異なる人が作ったControlNetMediaPipeFaceというモデル用の前処理．目・口・顔の形や向きがわかる画像が生成される．
scribble	マウス入力の落書き　線を絶対的なものとしては扱わず、いい感じに仕上げる
fake_scribble	画像を一回落書き風に変換してscribbleに投入する
segmentation	'ADE20K'という規格で塗り絵領域に分類を持たせる
lineart_realistic	写真を線画に変換するやつ(v1.1追加)．cannyだとしきい値(threshold)をうまくやらないとボケている箇所の輪郭が抽出されないことがあったが，この処理ではその辺をいい感じの塩梅にして線を引いてくれる印象がある．
lineart_coarse	写真を線画に変換するものだが，lineart_realisticよりも粗い(雑な)線画になる(v1.1追加)

とりあえずスレにある画像使ったんであかんかったら消すわ

元画像から加工されたcannyやdepthなどの画像はデフォルトでは

stable-diffusion-webui\extensions\sd-webui-controlnet\detected_maps

に保存されているのでいいやつができたら取っておこう

得意不得意

ちょっと試した感じこんな感じでした

~~OpenPose: 奥行き苦手~~
NomalMap: 奥行き得意ただし背景が消失する(?)
DepthMap: 奥行き得意背景も死なない

Normal & Depth

OpenPoseは実写/イラストで検出精度が変わるみたいです

segmentation

塗り絵から構図と描くもの（人や道や木など150種類の概念から選べる）をコントロール・・・できそうなやつや。

ADE20Kって規格で塗り絵するで
物と事で色分けが違うらしい。雑に言うと「人間」は数えられるので「物」、「空」は数えられないので「事」
色分けの決まりは下参照

https://github.com/CSAILVision/sceneparsing/tree/m...
ADE20Kのオブジェクト-RGB対応表スプレッドシート https://docs.google.com/spreadsheets/d/1se8YEtb2de...

　↑スプレッドシートの色分けで上手くいかない場合はこちらを参照　https://github.com/Mikubill/sd-webui-controlnet/di...

こんなん人力では無理やという場合は元画像（実写が望ましい）を用意してWebで
https://huggingface.co/spaces/shi-labs/OneFormer
the task is semantic, ADE20K, DiNAT-L（最後はSwin-Lでも可、たぶん変換のモデルの違い？）
にチェック入れて送信すると右下に塗り分けられて出力される。
あとは適当なペイントツールで好きなように修正する。

めんどくさい！ようわからん！

とりあえず参考にしたい画像をドロップして
Preprocessor:segmentation, model:~_segにして出力してみる
出てきた塗り絵を適当なペイントツールで修正する。
ちなみに元画像はアニメ塗りより実写がいいらしい(って4chanで見た)→openposeの話やったすまん

複数人を塗り分けるには

https://huggingface.co/spaces/shi-labs/OneFormer
the task is panoptic, ADE20K, DiNAT-L
にチェック入れて送信すると
判定がゆるくなる代わりに人数分だけpersonの色が増えるので
適当なペイントツールで色分けして塗る。(人間が重なっていなければ塗り分けなくていい)

基本

229今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 8655-8lmq)2023/02/16(木) 15:33:50.21ID:g7tc6IYz0
>>226
まずsegに必要なのはADE20Kっていう画像内のオブジェクトをクラスごとに色分けしたやつや
各色とオブジェクトの紐づけはこのページとひとまとめにした画像を参照
基本は150色
https://github.com/CSAILVision/sceneparsing/tree/master/visualizationCode/color150
https://i.imgur.com/XXryPUX.png
すでに学習済みのデータセットやから残念ながら自分で色足したり設定変えたりはできん
ただしこのクラス分けもさらに細分化されたり混ぜ合わせたりが可能みたいや
詳しくは後述

ADE20Kのオブジェクト-RGB対応表スプシ
https://docs.google.com/spreadsheets/d/1se8YEtb2de...

236今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 8655-8lmq)2023/02/16(木) 15:43:14.25ID:g7tc6IYz0>>239
>>226
ほんで写真やイラストを変換したいときはここ使う
https://huggingface.co/spaces/shi-labs/OneFormer
segで使うにはthe task is semantic、ADE20K、DiNAT-Lを選ぶ(ワイもADE20K以外は選ぶ意味が分かってない)
https://i.imgur.com/Sc2gMxV.png
で変換すると右に二枚画像が出てくる
https://i.imgur.com/Bh7dOLM.pngこっちは「この色分がこのオブジェクトなんやで～」って説明
これを見ると分かると思うが明らかに基本の150色には無いオブジェクト名や色が出てくる
この辺がさっき話したほんとはもっと細かいという話やね
ADE20Kでググると細かいツリー画像出てくるからまぁそういうことなんやろ
https://i.imgur.com/nam6pNp.pngほんでこっちがwebUIに入れる色分け画像
プロンプトなしで色分けルールに沿ったもの大体出てくる

260今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 8655-8lmq)2023/02/16(木) 16:00:12.39ID:g7tc6IYz0>>363
>>226
後はちょっとした応用で、色分けで生成されるものが決まるので色の一覧表や欲しい要素がある画像を変換器に入れて出てきた色をスポイト抽出して
適当にペイントツールで塗り塗りしてその画像をsegに入れると好きな要素を好きな構図で出せるようになるわけ
これは前スレに貼ったskyとかmountainとかwaterの色塗って作った奥行きのあるなんか壮大そうな景色を出すやつ
landscapeとネガティブの(low quality,worst quality:1.4),(monochrome:1.1)のみ
https://i.imgur.com/Da7bWWv.png
https://i.imgur.com/mOB9khp.png
https://i.imgur.com/74r2uZx.png
欠点としては人の形もシルエットになるから腕や足が体に重なったポーズはうまく認識できなかったり、ありえんボリュームの髪のシルエットに無理やり引っ張られて奇形になったりすること

複数人を塗り分けて描画する方法

578今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 8655-8lmq)2023/02/16(木) 22:20:25.69ID:g7tc6IYz0>>580
まず複数人が登場する画像を用意する
今回はワイが以前AIで生成した画像やが相性的に実写寄りの絵か写真のほうが好ましい
>>236でsemanticを選べと言ったがこの方法だと何人いようが体が重なってようが離れていようがpersonは一色しか出てこないんや
https://i.imgur.com/q1n8yln.png
なので画像変換の時にpanopticを選ぶと色々と認識ガバガバになる代わりに人数分だけpersonの色を用意してくれるんや
https://i.imgur.com/nYCNpRB.png
その複数出てきたpersonの色で塗るとそれぞれ別人と認識してくれるんや
ただしこの通りのガバガバ色分けやからsemanticみたいに変換した画像を直にwebuiに入れるのはまず無理やね

580今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 8655-8lmq)2023/02/16(木) 22:23:04.48ID:g7tc6IYz0>>582
>>578
例えば抽出したそれぞれのperson色を使ってhttps://i.imgur.com/fIUQSnI.pngを作る
これをsegに突っ込むとhttps://i.imgur.com/u8A3WmX.png
狙ったのとはちょっと違うんやけどまぁそれぞれの色を別の人間と認識して融けたりしてないというのが大事や
重なり合った部分をちゃんとさせたいならレイヤー分けぐらいはできるペイントツールがあったほうがええやろな
割とダイレクトにシルエットの形状が体型に影響するのであんまり適当やと肩幅や顔のデカさがすごいことになったりする(というかなった)
手描き苦手ニキはデザインドールとかでポーズ取らせた画像に塗るのがええと思うで

591今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 8655-8lmq)2023/02/16(木) 22:35:11.73ID:g7tc6IYz0
ちゃんと変換に入れる人数が増えるとその分の色が出てくるので3人の画像使えば3色使って
https://i.imgur.com/HE9FtVa.pngこんなんを描いて
https://i.imgur.com/ja6fzus.pngちゃんと左が一番手前で右が一番奥な画像が出せる
こんなマウスで適当に引いた絵じゃなければ変な袖とか出ないでもっと綺麗に出るはずやで
何なら指とかも書き込めばちゃんと認識してくれる
逆に言えばこのレベルの絵でも融け合わないで位置関係把握してくれるんや
ちなみに体が重なってないなら色分ける必要ないで
一色でそれぞれ人型描いてもええしsemantic変換した画像そのまんま突っ込んでもええ
この通り複数人をあまり混ざらず出せるのがメリットやが
オリジナルの構図にしたかったらなんやかんや結構な技量とセンスが問われるのがデメリットやと思う
労力割かずに複雑なポーズ一発出しならそこは断然openposeや
使い分けていこう

輪郭線を白で描くことで、腕組の表現の打率を上げる

701今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ cb28-BTrK)2023/02/20(月) 01:04:22.35ID:WCL0iJ9f0
>>690
なるほど、人物とかくっきり輪郭線付いてるね
試しに腕組seg作ってみたら重なる表現は相変わらず苦手だけどなかなか良さそうだった
色分けと上手く使い分けたいね
https://i.imgur.com/DUfpcSL.png
https://i.imgur.com/N9pdqX1.png
https://i.imgur.com/2H4eWAU.png
https://i.imgur.com/nPccccl.png

Guess Mode (実験的機能)

WebUIの設定 > Enable CFG-Based guidance をオン
ControlNet使用時に Guess Mode を有効にすると
cannyやdepthを使ってプロンプト無しでも~~いい感じにでっち上げる~~柔軟に推論する機能
サンプリング回数 50, CFGスケール 3 ～ 5 を推奨

例)NSFW, 1girl, NC: (worst quality:1.4), (low quality:1.4) , (monochrome:1.1), のみ

Controlnetモデル

ここではControlNetで使用する追加のモデルについて紹介。

cnlllite-anystyle

https://huggingface.co/2vXpSwA7/iroiro-lora/tree/m...

画像の構図を維持したまま衣装やキャラなど他の要素を変更できるControlnetモデル。

作者曰く

入力した画像から大雑把に構図と明暗を維持できるように作ったCN(ControlNet)

※注意 cnlllite(ControlNet-LLLite)はCNの軽量版でSDXL専用

従来のモデルであるDepthに近いが、それと違い構図は維持したまま髪型を変更することができる。
また、Scribbleのように線画を元絵として改善された絵を出す使い方も可能。

使い方(1111/forge)

cnlllite-anystyle_v3-step00004000.safetensorsを落としてくる(作者推奨が4000stepだから)
これをmodels\ControlNet配下に置く
WebUIを起動する
ControlNetのEnableをチェック(forgeはControlNetのチェックボックスも有効にする)
Control TypeはAllのままでPreprocessorもnoneのままでいい
Preprocessorの横のModelの横の🔄️を押してモデル一覧を再読み込み
Modelの中の多分一番上にcnlllite-anystyle_v3-step00004000.safetensorsが出てくるからそれを選択
あとは元にしたい画像をSingle Imageに投げ込んで画像生成

うまく動かないときは
https://fate.5ch.net/test/read.cgi/liveuranus/1714... によると「latentをいじったりするような拡張が入っていると、干渉してエラーを吐くっぽい」とのこと。
このニキはKohya HRFixの拡張機能をオフにすると動作したという。
設定でHyperTileがオンになっていてエラーが発生したという報告もあった。
または、出力解像度をモデルの推奨解像度か32の倍数にする。詳しくはAnimagine 3.1tipsやPony Diffusion V6XLtipsのページを参照。
ほかにもfp8で動かない可能性があるが環境によるかも。fp8を有効にした1111WebUI 1.9.0、CN1.1.445で動作した。

anytest

https://huggingface.co/2vXpSwA7/iroiro-lora/tree/m...

cnlllite-anystyleと同じ月須和・那々氏（https://x.com/nana_tsukisuwa）によるControlNetモデル。SDXL専用。使い方も共通で仕上がりの向上を目指したもの。

CN-anytest_v4-marged.safetensors

そのほか「amがanimagine用、pnがpony用」もある。「それぞれdim8～dim256まで用意しました、dimが小さいと制御力が下がりますが、用途によってはその方が逆に丁度良くなるかもしれません」（v3に関して）とのこと。

anytest_v4は「step数で性質が変わってて、どれが出来が良いstepか分かんなかったので、試しにそれぞれのstepのCNをマージして平均化した版を上げた」。「入力に対する正確さよりスタイル変換と入力画像の幅広さを重視した／基本v3と同じような使い方が出来るけど、v3に比べると割とガバい、scribble寄りのCNかな／まぁそのガバさ故に、入力がノイズまみれだろうがモザイクかかっていようがぼやけてようが出力が壊れないっていう」。

ツール

WebUIの拡張機能

Openpose Editor

https://github.com/fkunn1326/openpose-editor

棒人間の2Dモデルを操作してOpenposeの画像を作成します。

Posex - Estimated Image Generator for Pose2Image

https://github.com/hnmr293/posex

棒人間の3Dモデルを操作してOpenposeの画像を作成します。

3D Openpose Editor

https://github.com/nonnonstop/sd-webui-3d-open-pos...

棒人間の3Dモデルを操作してOpenposeの画像を作成します。
Openposeだけでなく、手足のDepth/Normal/Cannyマップの出力にも対応しています。

Webブラウザで動くアプリケーション

PoseMaker - a Hugging Face Space by jonigata

https://huggingface.co/spaces/jonigata/PoseMaker2

棒人間の2Dモデルを操作してOpenposeの画像を作成します。

Magic Poser

https://webapp.magicposer.com/

人体の3Dモデルを操作してOpenposeやDepth用の画像を作成できます。

Online 3D Openpose Editor

https://zhuyu1997.github.io/open-pose-editor/

人体の3Dモデルを操作してOpenposeやDepth用の画像を作成できます。

ローカルで動くアプリケーション

デザインドール

https://terawell.net/ja/

人体の3Dモデルを操作してOpenposeやDepth用の画像を作成できます。
体験版ではポースをセーブできません。

Blender

Character bones that look like Openpose for blender

https://toyxyz.gumroad.com/l/ciojz?layout=profile

ILLUSION製ゲーム（エロゲ）のプラグイン

ハニーセレクト2

Illusion HoneySelect2 OpenPose Plugin
https://lap0705.gumroad.com/l/ellqe
- ※有料（1$）です。
- openpose_handにも対応しています。

コイカツ

ControlNet tools for Koikatsu
https://civitai.com/models/17390/controlnet-tools-...

アセット

Openpose

Openposeリグの画像をシェアすることで、手軽にポーズアセットとして配布できるようです。
使用時はプリプロセッサ：None、Model：Openposeにしてポーズ画像をImageにドラッグ&ドロップします。

キャラクター設計図

いわゆるキャラデザ：Turnaround資料を生成できるやつ
とりあえずRTX3060 12GBでHires. fix resize: from 1024x512 to 2201x1100ぐらいまで生成できました。

BlenderのOpenposeRigで作成。
キャラデザ用

生成例

サンプル

活用例

Scribble と Openpose 同時使用

Scribble と Openpose を Multi CN で適用すると、ワイのクソヘボ落書きでも姿勢の打率爆上がりするな
Openpose のみやとなんか姿勢固くなっちゃうし、Scribble でサポートするのもいいかもしれん
棒人間はとしあきさんとこのツールを使わせてもろてるで
半透明モードがあるのでキャンバスの上から関節位置を調整してる
CN 設定はこんな感じ
一回 t2i で構図決めてから i2i で Step と CFG を上げて高画質化しとる

ずらしハメパンツ修正メソッド（t2i簡単超高打率）

t2iのプロンプトpanties asideで出したずらしハメ…しかし結果はそうじゃない違うんだよ…それが許されるのはブルマとパンツだけなんだ…そんな時に有効な方法
1.画像をControlnetのCannyを通して出力された線画をドラッグ＆ドロップでローカルに保存
2.パンツの不要部分をペイントアプリで除去（白で塗りつぶす）
3.修正した線画をControlnetにドラッグ&ドロップ
4.Preprosessor:Canny、Model:Canny、Weight:0.7±0.2程度
5.プロンプトpanties asideの強度を0にする(panties aside:1.5) → (panties aside:0)
メリット:超高打率でガチャほぼ不要　デメリット:色が少し薄くなる、細部がちょっと変わる
なお、hedでも同様のことが可能。hedの場合は4のPreprosessorをnoneにする。こちらは出力が濃くなる。お好みでどうぞ。

depth と hed 併用

https://twitter.com/Zuntan03/status/16293629745479...

Scribble + Normal, Depth

1. Scribble でゴミのような線画をいい感じのリファレンスにしてもらう
2. Daz で用意したなんとなくそれっぽいモデルを Blender に持ち込んで髪の毛だけ別に配置する
3. Normal, Depth を出力してそれぞれ ControlNet で使用してみる。Prompt はある程度具体的に指定しておいた方がよさそう

Normal はちゃんと背景まで作りこんでおかないといけなそう
Depth は背景は勝手にいい感じにしてくれるけど後ろ髪をあんまり髪として認識してくれなかった

ちな Blender から Normal 出力するときは Viewport Shading から Matcap Normal を適用して、Viewport Render Image で書き出す
Outline は無効にしておいた方がエイリアスがなくてよさそう
ControlNet での使用時は RGB to BGR にチェック
Depth は Depth Pass を Normalize + Invert して書き出す
マテリアルに半透明があると Depth にノイズが乗っちゃうので、不透明なマテリアルで Override しておく

inpaint

inpaintのcontrolnetでもできるで
一つの方法としては
元画像をt2iのcanyに通して線画を出力する。線画はドラックアンドドロップで適当なフォルダに落とせば保存できる
胸のところの線画を加工して雑でもいいからおっぱいにする
それをcontrolnetに置いて、Preprocessorをnoneにしてmodelをcanyにする
元絵は上半身をインペイントで黒くする
プロンプトはshirt lift, breasts, underwearとか描きたい要素を入れる
加工が面倒ならdepth画像無加工でWeight落とすだけでもいけるかも

同じ構図で別のモデルに書かせる

同じ構図で別のモデルに書いてほしい場合はControlNet 1.1のTile使うとええな
img2imgに比べてCN Tileは全モデルでスカートちゃんとたくし上げてくれとる

img2img(ノイズ除去=0.7)
（画像1枚目）

ControlNet Tile
（画像2枚目）
設定
（画像3枚目）

3Dモデルの動画から作成

＜3Dモデルの元動画準備＞
VRoid＋Unity/BlenderなりMMDなりコイカツなりで動画撮る→なんかのソフトで連番画像に変換
＜基本設定＞
・Control Netは2つ使えるようにSettingsで設定しておく
→i2iで、CNのlineart anime+tileでシード適当に固定
→好きなプロンプト入れて、index（WebUIの○○/75とか右上に出ている奴）をメモ
→MasaのForeground Indexesにその数字を入力、「LOGGING」をクリック
＜メイン処理＞
・連番画像の最初の1枚目を処理、問題なさそうならLOGGINGをRECONに変え全部画像処理

https://fate.5ch.net/test/read.cgi/liveuranus/1684...

lineart_anime+tileで大量bukkake（通称カムカム法）

冗談みたいな量のbukkakeをどんな構図でも安定して出すことに成功したんやで
png info https://files.catbox.moe/kw9t5u.png
https://files.catbox.moe/9a4wxk.jpg
https://files.catbox.moe/cnau87.jpg
https://files.catbox.moe/ml99vm.jpg

ControlNetを2つ用意して、1つ目をlineart_anime, weight0.3くらい, Start0.1, Ending0.7くらいに設定してこのテクスチャを指定
https://files.catbox.moe/87gvo4.png
2つ目をtileにしてWeight1.0, Start0.0, Ending0.1くらいに設定してこっちのテクスチャを指定（↑のテクスチャでもいい）でOKや
https://files.catbox.moe/teinah.png
プロンプトでcumを意識させて、lineartとかで精液の輪郭を誘導して、tileとかで精液の色を埋め込んで、3重に指定するのがこだわりポイントや
weightやstrengthを弄ればimg2imgやinpaintでも使えるから応用してみてや。テクスチャ変えれば血まみれとかも作れるかもしれへんし

https://fate.5ch.net/test/read.cgi/liveuranus/1687...

テクスチャ法

0140今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 93a6-aBQB)
テクスチャ法成功や！画面が派手派手で楽しい！

https://i.imgur.com/pmQAaTN.jpg
https://i.imgur.com/qswgWhC.jpg
https://i.imgur.com/xmWIyuG.jpg
https://i.imgur.com/Zk8RbTg.jpg
https://i.imgur.com/ZyzOwU3.jpg

0142今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ ff88-ATpV)
>>140
すげぇ綺麗
元のテクスチャってどうやって作ってる？
ただのノイズなら生成すぐ止めれば出てくるけど好きな配色のノイズを作る方法がわからない

0151今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 93a6-aBQB)
2023/09/02(土) 01:36:35.10ID:1kfWqEzD0
>>142
サンガツ！photoshopのブラシツールで作ったで。カンバスカラーは白。ランダム性もたせるために「散布」「間隔」の項目は要設定や。イメージさえあれば10秒くらいで作れるで。photoshop無くてもフリーソフトでいけそうやな
目的の色・形状でテクスチャつくることが重要やと思うわ
ワイの場合は「某英雄王をコンセプトに画面内に沢山のマジックサークルが欲しい→黄色の円一杯あったらいいんじゃね」ってとこからスタートした。背景ノイズはよくわからんから試しに白紙にしたら狙い通りにいった形や
ただcontrolnetのtileのweight次第で結構変わるんで要検証や
weight 0.7 https://files.catbox.moe/xaw8mm.webp
weight 0.3 https://files.catbox.moe/z16wrb.webp
実際に使ったテクスチャ
https://files.catbox.moe/s3fpb7.png

知っとるかもしれんが御月氏のnoteを参考に生成したで
https://note.com/mitsukinozomi/n/ne735cc59afd1

下記は>>140の最初3つの画像

https://fate.5ch.net/test/read.cgi/liveuranus/1693...
https://note.com/mitsukinozomi/n/ne735cc59afd1

プリプロセッサ Shuffle、モデル Inpaintで構図に一捻り


0414今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 7f17-ATpV)
2023/09/03(日) 10:06:34.14ID:cid4WzhP0
プリプロセッサ Shuffle、モデル Inpaintで構図に一捻り加えられるやつの実例を作ってみた
プロンプトは両方とも全く同じ
気の利いた構図をお手軽に錬成できて便利やね
https://i.imgur.com/DIj2Nbk.jpg
https://i.imgur.com/aYTaeFN.jpg

0416今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 7f17-ATpV)
設定はこんな感じや、CNに読ませる画像はなんでもええと思う
Control Modeは必ずMy prompt is more importantにしすること（これ以外は元画像が浮き出てくる）
Preprocessor Resolutionの最適値は画像とモデル、生成したイラストの方向性によるんで微調節必須やな

https://i.imgur.com/WHvdiEq.jpg

0458
これって捻り具合はどこで調整するんや
とりあえずcontrolnetのweightをいじってみたんやが

0466今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 7f17-ATpV)
2023/09/03(日) 16:15:13.11ID:cid4WzhP0
>>458
Preprocessor Resolutionで調節やね
>>463
ワイもまだ原理をちゃんと理解してないんやが、t2iでの画像生成にモデルinpaintを用いると
「読ませた画像の色味の境界に沿った構図を生成する」っぽいんや
たとえばshuffleで歪ませずに>>416 のなんJで生成するとこういう感じになる

https://i.imgur.com/nsBS18Y.png　https://i.imgur.com/0wlvurf.png
https://i.imgur.com/uo97wer.png　https://i.imgur.com/kXFgB0P.png

これはこれで構図を誘導したりだまし絵を作るのに有用っぽいんやけど
さらにshuffleで曲線的・円的に歪ませて、いわゆるアクションラインを示してやるのが狙いや

下記は>>414の画像

動画

外人ニキやけど早送りでもだいたい分かる https://www.youtube.com/watch?v=ci7NfTsifd0

古い記載

このページを編集するこのページを元に新規ページを作成

印刷する

コメント（24）

カテゴリ：
漫画/アニメ
総合

ControlNet - NovelAI 5ch Wiki 先頭へ

このページへのコメント

Inpaintで画像修正入れるときに
同じ画像をControlnetに入れて
CannyでWeight控えめ＋End段数浅めにしてやると
元の画像からそれほど離れないちょうどいい感じに修正できるから
差分作るときにかなり安定してできるようになったわ

Posted by 名無し(ID:poy9HFsJbA) 2023年09月26日(火) 18:54:01 返信

twitter等にある、MMDモデルのダンスをMulti ControllNetで、キャラクターに躍らせるといったものはどうやってやるのでしょうか？

Posted by 名無し(ID:cpExXIjjpA) 2023年04月18日(火) 11:46:22 返信

なんか4/15にControlnet機能拡張されてない？以前の数倍ぐらい選択肢があるんだが・・・

Posted by 名無し(ID:RRv03sDWPA) 2023年04月16日(日) 01:41:35 返信

まだWebUIで使えないですが、顔を制御するためのControlNetがでました。

ttps://www.sdcompendium.com/doku.php?id=face_landmark_controlnet_0103

Posted by 名無し(ID:LRhSV/5kZA) 2023年03月19日(日) 16:21:38 返信

Guess Mode (実験的機能)の元画像が見える見える…

Posted by 名無し(ID:KZ21yRhOhQ) 2023年03月19日(日) 06:48:12 返信

コメントをかく

名前	ユーザIDを使用しないで書き込む	ユーザーIDを使う	ログインする
備考	「http://」を含む投稿は禁止されています。
本文
利用規約をご確認のうえご記入下さい

NovelAI 5ch Wiki

ControlNetについて

詳細

i2iとの違い

インストール

使い方

Preprocessorの種類と特徴

得意不得意

segmentation

めんどくさい！ようわからん！

複数人を塗り分けるには

輪郭線を白で描くことで、腕組の表現の打率を上げる

Guess Mode (実験的機能)

Controlnetモデル

cnlllite-anystyle

anytest

ツール

WebUIの拡張機能

Openpose Editor

Posex - Estimated Image Generator for Pose2Image

3D Openpose Editor

Webブラウザで動くアプリケーション

PoseMaker - a Hugging Face Space by jonigata

Magic Poser

Online 3D Openpose Editor

ローカルで動くアプリケーション

デザインドール

Blender

Character bones that look like Openpose for blender

ILLUSION製ゲーム（エロゲ）のプラグイン

ハニーセレクト2

コイカツ

アセット

Openpose

キャラクター設計図

サンプル

活用例

Scribble と Openpose 同時使用

ずらしハメパンツ修正メソッド（t2i簡単超高打率）

depth と hed 併用

Scribble + Normal, Depth

inpaint

同じ構図で別のモデルに書かせる

3Dモデルの動画から作成

lineart_anime+tileで大量bukkake（通称カムカム法）

テクスチャ法

プリプロセッサ Shuffle、モデル Inpaintで構図に一捻り

動画

古い記載

このページへのコメント

コメントをかく

Menu

はじめに

技術解説・ツール紹介

プロンプトテクニック

部活動

Prompts

R18系Prompts

ローカル部

なんJnovelAI部過去ログ

Wiki

最近更新されたスレッド

2024-07-24

2024-07-20

2024-07-17

2024-07-12

最近更新したページ

2024-07-26

2024-07-25

2024-07-24

2024-07-23

2024-07-22

2024-07-21

最新コメント

2024-07-26

2024-07-25

2024-07-23

2024-07-22

QRコード