高解像度で生成する方法

はじめに

生成した画像をさらに高解像度に拡大する方法のまとめページ
Automatic1111のHires.fixとその他さまざまな拡張機能がメインになりそうだけど単体で動作するツールもあるのでページはわけてある。

Automatic1111まわり

Hires.fix

ビルトインのアップスケーリング機能

みんな雰囲気で使ってる
沼が深い
人体を破綻させる天才(Latent系のみ)

※v1.6.0あたりから有効化する方法がチェック方式からトグル方式に変わった
Hires.fixしたいときはトグルを展開した状態で生成するとアップスケールされる
参照：https://www.reddit.com/r/StableDiffusion/comments/...

アップスケーラー

使用上の注意：Latentで始まるやつはdenoising strengthの値が低い（おおよそ0.5以下）とギザギザになってぼやけるので不適切。

https://fate.5ch.net/test/read.cgi/liveuranus/1674...
778: 2023/01/29(日) 07:22:10.14
hires.fix 3倍とか空白に変なもん書き込みまくって使い物にならんだろ
横長画像自体が破綻の元だし512×768のhires 2倍で良い
重いサンプラー使って前後どっちも50stepで3060でも3分

https://fate.5ch.net/test/read.cgi/liveuranus/1674...
782:2023/01/29(日) 07:33:44.49

>776

ステップは20でじゅうぶんやで
CFGは7
これでクオリティ落とさずに速度改善するで
サンプラーはDPM++2Mkarrasが速くてクオリティも良いで
DDIMも独特な描き込みが増えて良い、DDIMの場合ステップ少し増やしてや
SDEカラスはハイレゾで極端に遅くなる時があるのとハイレゾらしい書き込み量増加が物足りん時があるので
ハイレゾの時は使わんくていいかな
拡大後ってのはhires stepのことやろか？
これはゼロでええで、いうほどディテール増えん
アップスケールは描き込み増やしたいならlatent１択や

https://fate.5ch.net/test/read.cgi/liveuranus/1675...
716: 2023/02/01(水) 14:32:23.56

>712

というかt2iのアップスケーラーでもnone選べばi2iと一緒や
いや正確には出力条件違うから細部は異なってくるんやけど拡大の方向性は一緒でグチャったりはしない
あとは二次元系ならanime6Bはいい感じに絵を保ちながら線や陰影をはっきりさせて拡大してくれる

というかアップスケーラーとしてはt2iのデフォのLatentがちょっと異質
ノイズも潜在要素も拾いまくって再描写するから美麗系のモデルでうまくいくとゴージャスになるけどクリーチャー生まれまくるしシンプルアニメ系のモデルだと服融けたり線ぼやけるだけ

https://fate.5ch.net/test/read.cgi/liveuranus/1676...
423: 2023/02/20(月) 21:52:46.12
アップスケーラーは「Latent」がつくのとそれ以外で傾向が違う
「Latent」は拡大時にディテールアップしてくれるがノイズ除去強度を下げるとボケたり絵が破綻したりする
それ以外はディテールアップはほどほど、ノイズ除去強度を下げて元絵と変えずにスケールアップもできる
ESRGAN_4xとSwinIR_4xがよく使われている気がする

図：4chanあたりで作られた図表をだれかが翻訳した熱い図表

207: 2023/03/03(金) 09:26:19.24

>45

ちょうど良い画像だから使わせてもらうけど
少し前のスレで話題にした後処理（その他タブ）アップスケーラーの違い

元の絵

Real「CUGAN」は良くも悪くも元絵のまま拡大するから細かい部分は維持できるけどノイズとかもそのまま
質感を保ちたいリアル系と相性が良い

Tile

605: 2023/03/20(月) 11:27:02.22
hires 1.8倍なら2分で済むのに
1.9倍だと終了間際に急にメモリ最大に張り付いて固まって4分かかるのって普通なんかな
ワイのGPUのメモリ使い切る壁がここにあるんやろか

638: 2023/03/20(月) 12:51:10.16

>605

重複部分のドット数はアップスケーラーや手法によって変わるけど
ざっくりいうとこんな感じで回数が増えるイメージかな(色の塗方が適当ですまん)
512の2倍近辺っていうのはものスゲー効率が悪いのだけは伝わるといいな

MultiDiffusion

pkuliyi2015/multidiffusion-upscaler-for-automatic1111: MultiDiffusion implementation with VAE VRAM optimize - https://github.com/pkuliyi2015/multidiffusion-upsc...
出力画像を細かく分割し、それぞれにアップスケールを掛けたものを1枚に合成してくれる
それにより低VRAMユーザーでも4k画像などの高解像度にアップスケールする事が可能
横幅32000とかの超ワイド画像も出来る

難点はその処理方法故に生成時間が膨れあがる事と、小人(妖精さん)が発生しやすくなる事

Civitaiにあるチュートリアル
https://civitai.com/models/34726/tutorial-for-mult...

アップ&ダウンをして描き込みを増やす方法

https://fate.5ch.net/test/read.cgi/liveuranus/1679...
452 2023/03/26(日)

>446

1. extensionsでmultidiffusion-upscaler-for-automatic1111 をインストール
2. i2iのTiled DiffusionでEnableにチェック、MethodはMultiDiffusion、Upscalerを好きなのに設定してScale Factorで拡大率を設定。Keep input image sizeにもチェック。あとはとりあえずデフォルト値でよし
3. 大抵の場合VRAMが足りないので、Tiled VAEの方もEnableにチェック
4. Generateクリックしてi2iでアップスケール実行！やで

あとは、アップスケールされたのを縮小してもう一度アップスケールかけるもよし、縮小なしでアップスケールするもよし
縮小しない方が描き込み量増える感じがするけど、実行時間はガンガン増えていくで

>446

あっとそうだ、プロンプトはクオリティタグだけにせよってREADMEに書いてあるけど、適当に補完した方がアップスケールの出来は良くなる
あとは……CFGは10くらい、denoisingは0.3 - 0.5くらいがいいで

小人の発生を防ぐ方法

タイルを何枚もつぎ足しして生成する関係上アップスケーラーによってはいたるところに1girlを描こうとするため小人が多数発生し、さながらウォーリーを探せ状態になる。

https://fate.5ch.net/test/read.cgi/liveuranus/1679...
540: 2023/03/24(金)

>524

絵を借りてやってみたがこんなんでどうや?

パラメータ等はpastebinに置いた https://pastebin.com/PiGMstfE
CFG Scalleを上げる、Denoising Strengthを若干下げる、tile width を64に下げるあたりが聞いてそうな感じがするがワイもこのへん適当や
なおtile widthの値を下げると生成時間が長くなる、この設定だと4090で6:46ほどかかっとる

https://fate.5ch.net/test/read.cgi/liveuranus/1679...
544:

>535

やってみたで
背景プロンプトのみ＋no humans　denoise0.4

タグ全残し　denoise0.4

たしかに小人出なくなったがキャラ属性が消えてしまうわな

その他

>524

CNでイラストをある程度固定した方がいい
俺もハイレゾ化瞬間に崩れるのはモデルとprompt次第でよく見る
それでも崩れる時は崩れるけど・・・

ネタ

Controlnet 1.1 のCN tile(tile_resample)を併用

Controlnetに追加された数々の機能の1つ、CNtileをMultiDiffusionと併用して高解像度にする

メリット
- Denoising strengthを最大の1にしても小人さんが発生しない
- 元絵にほぼ忠実な状態で高解像度化が出来る
デメリット
- 処理時間が数倍かかる(4k化に20分等)

1. extensionsで sd-webui-controlnet をインストール
2. ControlNet 1.1のmodelをダウンロードし、\extensions\sd-webui-controlnet\models にセット
　必要なのは control_v11f1e_sd15_tile.pth と control_v11f1e_sd15_tile.yaml
3. Controlnetを有効にし、プリプロセッサに tile_resample　モデルに control_v11f1e_sd15_tile を選択
3. MultiDiffusion の設定を入れる
5. Generateクリックしてi2iでアップスケール実行

スレ207の868ニキ推奨設定

868 名前：今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 6312-keRw)[sage] 投稿日：2023/05/18(木) 14:49:53.98 ID:woSwpoup0
ニキ達、tile diffusionの公式見てないんか？　Denoising strength０．５　ってのはもう昔の話やぞ
小人出さんように恐る恐るdenoise調整する時代はCNtileの登場で終わったんや

最新の推奨設定は
・Denoising strength１　（最大値ってことや）
・Method　Mixture of Diffusers　（デフォのmulti diffusionちゃうで）
・Noise Inversion　Inversion steps２００　（最大値や）
・Renoise strength０　（ゼロにしてええんや）
・CNtile使用　（タイル有効にしたら何もいじらん画像も貼らんでいい）

これや

ツール

単体で動くやつら

Waifu2x-Caffe

Web｜waifu2x - https://waifu2x.udp.jp/index.ja.html
Windows｜lltcggie/waifu2x-caffe: waifu2xのCaffe版 - https://github.com/lltcggie/waifu2x-caffe
Windows｜nagadomi/nunif: waifu2xの新モデルが使える - https://github.com/nagadomi/nunif/blob/master/waif...

深層畳み込みニューラルネットワークによる二次元画像のための超解像システム。
いにしえ(2015年くらい)からあるアップスケーリングツール
でも今でも比較的良い結果が得られて十分使える(個人的見解)

PixSr4x

PixSr4x - イラスト向け4倍超解像Windowsアプリケーション - https://kohya.devel.jp/pix_sr_4x/
LoRA用学習スクリプトでお世話になってる人も多いkohyaニキがむかし作ってたやつとのこと

Sample

192: としあき 2023/03/04(土)
kohya氏が昔作ったというPixSr4xっていうツールが使いやすくてよく使ってますな
横からだけどこれスゴいね
512x512で出力したのをアップスケールしてみたけど潰れてた汗表現とかよだれまでちゃんと綺麗にしてくれたわ

このページを編集するこのページを元に新規ページを作成

印刷する

コメント（0）

カテゴリ：
漫画/アニメ
総合

高解像度で生成する方法 - NovelAI 5ch Wiki 先頭へ

コメントをかく

名前	ユーザIDを使用しないで書き込む	ユーザーIDを使う	ログインする
備考	「http://」を含む投稿は禁止されています。
本文
利用規約をご確認のうえご記入下さい

NovelAI 5ch Wiki