画像生成AIの情報を纏めるWikiです。

はじめに

生成した画像をさらに高解像度に拡大する方法のまとめページ
Automatic1111のHires.fixとその他さまざまな拡張機能がメインになりそうだけど単体で動作するツールもあるのでページはわけてある。



Automatic1111まわり

Hires.fix

ビルトインのアップスケーリング機能
  • みんな雰囲気で使ってる
  • 沼が深い
  • 人体を破綻させる天才(Latent系のみ)

※v1.6.0あたりから有効化する方法がチェック方式からトグル方式に変わった
Hires.fixしたいときはトグルを展開した状態で生成するとアップスケールされる
参照:https://www.reddit.com/r/StableDiffusion/comments/...

アップスケーラー

使用上の注意:Latentで始まるやつはdenoising strengthの値が低い(おおよそ0.5以下)とギザギザになってぼやけるので不適切

https://fate.5ch.net/test/read.cgi/liveuranus/1674...
778: 2023/01/29(日) 07:22:10.14
hires.fix 3倍とか空白に変なもん書き込みまくって使い物にならんだろ
横長画像自体が破綻の元だし512×768のhires 2倍で良い
重いサンプラー使って前後どっちも50stepで3060でも3分

https://fate.5ch.net/test/read.cgi/liveuranus/1674...
782:2023/01/29(日) 07:33:44.49
>776
ステップは20でじゅうぶんやで
CFGは7
これでクオリティ落とさずに速度改善するで
サンプラーはDPM++2Mkarrasが速くてクオリティも良いで
DDIMも独特な描き込みが増えて良い、DDIMの場合ステップ少し増やしてや
SDEカラスはハイレゾで極端に遅くなる時があるのとハイレゾらしい書き込み量増加が物足りん時があるので
ハイレゾの時は使わんくていいかな
拡大後ってのはhires stepのことやろか?
これはゼロでええで、いうほどディテール増えん
アップスケールは描き込み増やしたいならlatent1択や

https://fate.5ch.net/test/read.cgi/liveuranus/1675...
716: 2023/02/01(水) 14:32:23.56
>712
というかt2iのアップスケーラーでもnone選べばi2iと一緒や
いや正確には出力条件違うから細部は異なってくるんやけど拡大の方向性は一緒でグチャったりはしない
あとは二次元系ならanime6Bはいい感じに絵を保ちながら線や陰影をはっきりさせて拡大してくれる

というかアップスケーラーとしてはt2iのデフォのLatentがちょっと異質
ノイズも潜在要素も拾いまくって再描写するから美麗系のモデルでうまくいくとゴージャスになるけどクリーチャー生まれまくるしシンプルアニメ系のモデルだと服融けたり線ぼやけるだけ


https://fate.5ch.net/test/read.cgi/liveuranus/1676...
423: 2023/02/20(月) 21:52:46.12
アップスケーラーは「Latent」がつくのとそれ以外で傾向が違う
「Latent」は拡大時にディテールアップしてくれるがノイズ除去強度を下げるとボケたり絵が破綻したりする
それ以外はディテールアップはほどほど、ノイズ除去強度を下げて元絵と変えずにスケールアップもできる
ESRGAN_4xとSwinIR_4xがよく使われている気がする


図:4chanあたりで作られた図表をだれかが翻訳した熱い図表



207: 2023/03/03(金) 09:26:19.24
>45
ちょうど良い画像だから使わせてもらうけど
少し前のスレで話題にした後処理(その他タブ)アップスケーラーの違い

元の絵


Real「CUGAN」は良くも悪くも元絵のまま拡大するから細かい部分は維持できるけどノイズとかもそのまま
質感を保ちたいリアル系と相性が良い


Tile

605: 2023/03/20(月) 11:27:02.22
hires 1.8倍なら2分で済むのに
1.9倍だと終了間際に急にメモリ最大に張り付いて固まって4分かかるのって普通なんかな
ワイのGPUのメモリ使い切る壁がここにあるんやろか

638: 2023/03/20(月) 12:51:10.16
>605
重複部分のドット数はアップスケーラーや手法によって変わるけど
ざっくりいうとこんな感じで回数が増えるイメージかな(色の塗方が適当ですまん)
512の2倍近辺っていうのはものスゲー効率が悪いのだけは伝わるといいな




MultiDiffusion

pkuliyi2015/multidiffusion-upscaler-for-automatic1111: MultiDiffusion implementation with VAE VRAM optimize - https://github.com/pkuliyi2015/multidiffusion-upsc...
出力画像を細かく分割し、それぞれにアップスケールを掛けたものを1枚に合成してくれる
それにより低VRAMユーザーでも4k画像などの高解像度にアップスケールする事が可能
横幅32000とかの超ワイド画像も出来る

難点はその処理方法故に生成時間が膨れあがる事と、小人(妖精さん)が発生しやすくなる事

Civitaiにあるチュートリアル
https://civitai.com/models/34726/tutorial-for-mult...
アップ&ダウンをして描き込みを増やす方法
https://fate.5ch.net/test/read.cgi/liveuranus/1679...
452 2023/03/26(日)
>446
1. extensionsでmultidiffusion-upscaler-for-automatic1111 をインストール
2. i2iのTiled DiffusionでEnableにチェック、MethodはMultiDiffusion、Upscalerを好きなのに設定してScale Factorで拡大率を設定。Keep input image sizeにもチェック。あとはとりあえずデフォルト値でよし
3. 大抵の場合VRAMが足りないので、Tiled VAEの方もEnableにチェック
4. Generateクリックしてi2iでアップスケール実行!やで

あとは、アップスケールされたのを縮小してもう一度アップスケールかけるもよし、縮小なしでアップスケールするもよし
縮小しない方が描き込み量増える感じがするけど、実行時間はガンガン増えていくで
>446
あっとそうだ、プロンプトはクオリティタグだけにせよってREADMEに書いてあるけど、適当に補完した方がアップスケールの出来は良くなる
あとは……CFGは10くらい、denoisingは0.3 - 0.5くらいがいいで

小人の発生を防ぐ方法

タイルを何枚もつぎ足しして生成する関係上アップスケーラーによってはいたるところに1girlを描こうとするため小人が多数発生し、さながらウォーリーを探せ状態になる。

https://fate.5ch.net/test/read.cgi/liveuranus/1679...
540: 2023/03/24(金)
>524
絵を借りてやってみたがこんなんでどうや?

パラメータ等はpastebinに置いた https://pastebin.com/PiGMstfE
CFG Scalleを上げる、Denoising Strengthを若干下げる、tile width を64に下げる あたりが聞いてそうな感じがするがワイもこのへん適当や
なおtile widthの値を下げると生成時間が長くなる、この設定だと4090で6:46ほどかかっとる

https://fate.5ch.net/test/read.cgi/liveuranus/1679...
544:
>535
やってみたで
背景プロンプトのみ+no humans denoise0.4

タグ全残し denoise0.4

たしかに小人出なくなったがキャラ属性が消えてしまうわな


その他
>524
CNでイラストをある程度固定した方がいい
俺もハイレゾ化瞬間に崩れるのはモデルとprompt次第でよく見る
それでも崩れる時は崩れるけど・・・


ネタ

Controlnet 1.1 のCN tile(tile_resample)を併用

Controlnetに追加された数々の機能の1つ、CNtileをMultiDiffusionと併用して高解像度にする
  • メリット
    • Denoising strengthを最大の1にしても小人さんが発生しない
    • 元絵にほぼ忠実な状態で高解像度化が出来る
  • デメリット
    • 処理時間が数倍かかる(4k化に20分等)

1. extensionsで sd-webui-controlnet をインストール
2. ControlNet 1.1のmodelをダウンロードし、\extensions\sd-webui-controlnet\models にセット
  必要なのは control_v11f1e_sd15_tile.pth と control_v11f1e_sd15_tile.yaml
3. Controlnetを有効にし、プリプロセッサに tile_resample モデルに control_v11f1e_sd15_tile を選択
3. MultiDiffusion の設定を入れる
5. Generateクリックしてi2iでアップスケール実行

スレ207の868ニキ推奨設定
868 名前:今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6312-keRw)[sage] 投稿日:2023/05/18(木) 14:49:53.98 ID:woSwpoup0
ニキ達、tile diffusionの公式見てないんか? Denoising strength0.5 ってのはもう昔の話やぞ
小人出さんように恐る恐るdenoise調整する時代はCNtileの登場で終わったんや

最新の推奨設定は
・Denoising strength1 (最大値ってことや)
・Method Mixture of Diffusers (デフォのmulti diffusionちゃうで)
・Noise Inversion Inversion steps200 (最大値や)
・Renoise strength0 (ゼロにしてええんや)
・CNtile使用 (タイル有効にしたら何もいじらん画像も貼らんでいい)

これや

ツール

単体で動くやつら

Waifu2x-Caffe

深層畳み込みニューラルネットワークによる二次元画像のための超解像システム。
いにしえ(2015年くらい)からあるアップスケーリングツール
でも今でも比較的良い結果が得られて十分使える(個人的見解)



PixSr4x

PixSr4x - イラスト向け4倍超解像Windowsアプリケーション - https://kohya.devel.jp/pix_sr_4x/
LoRA用学習スクリプトでお世話になってる人も多いkohyaニキがむかし作ってたやつとのこと


Sample
192: としあき 2023/03/04(土)
kohya氏が昔作ったというPixSr4xっていうツールが使いやすくてよく使ってますな
横からだけどこれスゴいね
512x512で出力したのをアップスケールしてみたけど潰れてた汗表現とかよだれまでちゃんと綺麗にしてくれたわ

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

Prompts

  1. 非R18詠唱全文
  1. 顔(目・口・表情)
  2. 構図
  3. 場所・背景
  4. 環境表現
  5. 特徴・年齢・体型・髪型
  6. ポーズ集
  7. 服飾
  8. 亜人・モンスター娘・人外
  9. 食品
  10. その他
  11. 画風
  12. 絵文字
  13. 色一覧
  14. 頻用ネガティブプロンプト
  15. 大量検証結果
  16. 整理用倉庫

編集中メニュー

  1. 未発見のプロンプト
  2. 旧ページ

table拡張js

どなたでも編集できます

メンバー募集!