最終更新:ID:hninFdIpoQ 2024年01月20日(土) 23:40:38履歴
生成した画像をさらに高解像度に拡大する方法のまとめページ
Automatic1111のHires.fixとその他さまざまな拡張機能がメインになりそうだけど単体で動作するツールもあるのでページはわけてある。
Automatic1111のHires.fixとその他さまざまな拡張機能がメインになりそうだけど単体で動作するツールもあるのでページはわけてある。
ビルトインのアップスケーリング機能
※v1.6.0あたりから有効化する方法がチェック方式からトグル方式に変わった
Hires.fixしたいときはトグルを展開した状態で生成するとアップスケールされる
参照:https://www.reddit.com/r/StableDiffusion/comments/...
- みんな雰囲気で使ってる
- 沼が深い
- 人体を破綻させる天才(Latent系のみ)
※v1.6.0あたりから有効化する方法がチェック方式からトグル方式に変わった
Hires.fixしたいときはトグルを展開した状態で生成するとアップスケールされる
参照:https://www.reddit.com/r/StableDiffusion/comments/...
使用上の注意:Latentで始まるやつはdenoising strengthの値が低い(おおよそ0.5以下)とギザギザになってぼやけるので不適切。
https://fate.5ch.net/test/read.cgi/liveuranus/1674...
778: 2023/01/29(日) 07:22:10.14
hires.fix 3倍とか空白に変なもん書き込みまくって使い物にならんだろ
横長画像自体が破綻の元だし512×768のhires 2倍で良い
重いサンプラー使って前後どっちも50stepで3060でも3分
https://fate.5ch.net/test/read.cgi/liveuranus/1674...
782:2023/01/29(日) 07:33:44.49
>776ステップは20でじゅうぶんやで
CFGは7
これでクオリティ落とさずに速度改善するで
サンプラーはDPM++2Mkarrasが速くてクオリティも良いで
DDIMも独特な描き込みが増えて良い、DDIMの場合ステップ少し増やしてや
SDEカラスはハイレゾで極端に遅くなる時があるのとハイレゾらしい書き込み量増加が物足りん時があるので
ハイレゾの時は使わんくていいかな
拡大後ってのはhires stepのことやろか?
これはゼロでええで、いうほどディテール増えん
アップスケールは描き込み増やしたいならlatent1択や
https://fate.5ch.net/test/read.cgi/liveuranus/1675...
716: 2023/02/01(水) 14:32:23.56
>712というかt2iのアップスケーラーでもnone選べばi2iと一緒や
いや正確には出力条件違うから細部は異なってくるんやけど拡大の方向性は一緒でグチャったりはしない
あとは二次元系ならanime6Bはいい感じに絵を保ちながら線や陰影をはっきりさせて拡大してくれる
というかアップスケーラーとしてはt2iのデフォのLatentがちょっと異質
ノイズも潜在要素も拾いまくって再描写するから美麗系のモデルでうまくいくとゴージャスになるけどクリーチャー生まれまくるしシンプルアニメ系のモデルだと服融けたり線ぼやけるだけ
https://fate.5ch.net/test/read.cgi/liveuranus/1676...
423: 2023/02/20(月) 21:52:46.12
アップスケーラーは「Latent」がつくのとそれ以外で傾向が違う
「Latent」は拡大時にディテールアップしてくれるがノイズ除去強度を下げるとボケたり絵が破綻したりする
それ以外はディテールアップはほどほど、ノイズ除去強度を下げて元絵と変えずにスケールアップもできる
ESRGAN_4xとSwinIR_4xがよく使われている気がする
図:4chanあたりで作られた図表をだれかが翻訳した熱い図表
207: 2023/03/03(金) 09:26:19.24
>45ちょうど良い画像だから使わせてもらうけど
少し前のスレで話題にした後処理(その他タブ)アップスケーラーの違い
元の絵
Real「CUGAN」は良くも悪くも元絵のまま拡大するから細かい部分は維持できるけどノイズとかもそのまま
質感を保ちたいリアル系と相性が良い
pkuliyi2015/multidiffusion-upscaler-for-automatic1111: MultiDiffusion implementation with VAE VRAM optimize - https://github.com/pkuliyi2015/multidiffusion-upsc...
出力画像を細かく分割し、それぞれにアップスケールを掛けたものを1枚に合成してくれる
それにより低VRAMユーザーでも4k画像などの高解像度にアップスケールする事が可能
横幅32000とかの超ワイド画像も出来る
難点はその処理方法故に生成時間が膨れあがる事と、小人(妖精さん)が発生しやすくなる事
Civitaiにあるチュートリアル
https://civitai.com/models/34726/tutorial-for-mult...
出力画像を細かく分割し、それぞれにアップスケールを掛けたものを1枚に合成してくれる
それにより低VRAMユーザーでも4k画像などの高解像度にアップスケールする事が可能
横幅32000とかの超ワイド画像も出来る
難点はその処理方法故に生成時間が膨れあがる事と、小人(妖精さん)が発生しやすくなる事
Civitaiにあるチュートリアル
https://civitai.com/models/34726/tutorial-for-mult...
https://fate.5ch.net/test/read.cgi/liveuranus/1679...
452 2023/03/26(日)
2. i2iのTiled DiffusionでEnableにチェック、MethodはMultiDiffusion、Upscalerを好きなのに設定してScale Factorで拡大率を設定。Keep input image sizeにもチェック。あとはとりあえずデフォルト値でよし
3. 大抵の場合VRAMが足りないので、Tiled VAEの方もEnableにチェック
4. Generateクリックしてi2iでアップスケール実行!やで
あとは、アップスケールされたのを縮小してもう一度アップスケールかけるもよし、縮小なしでアップスケールするもよし
縮小しない方が描き込み量増える感じがするけど、実行時間はガンガン増えていくで
あとは……CFGは10くらい、denoisingは0.3 - 0.5くらいがいいで
452 2023/03/26(日)
>4461. extensionsでmultidiffusion-upscaler-for-automatic1111 をインストール
2. i2iのTiled DiffusionでEnableにチェック、MethodはMultiDiffusion、Upscalerを好きなのに設定してScale Factorで拡大率を設定。Keep input image sizeにもチェック。あとはとりあえずデフォルト値でよし
3. 大抵の場合VRAMが足りないので、Tiled VAEの方もEnableにチェック
4. Generateクリックしてi2iでアップスケール実行!やで
あとは、アップスケールされたのを縮小してもう一度アップスケールかけるもよし、縮小なしでアップスケールするもよし
縮小しない方が描き込み量増える感じがするけど、実行時間はガンガン増えていくで
>446あっとそうだ、プロンプトはクオリティタグだけにせよってREADMEに書いてあるけど、適当に補完した方がアップスケールの出来は良くなる
あとは……CFGは10くらい、denoisingは0.3 - 0.5くらいがいいで
タイルを何枚もつぎ足しして生成する関係上アップスケーラーによってはいたるところに1girlを描こうとするため小人が多数発生し、さながらウォーリーを探せ状態になる。
https://fate.5ch.net/test/read.cgi/liveuranus/1679...
540: 2023/03/24(金)
>524絵を借りてやってみたがこんなんでどうや?
パラメータ等はpastebinに置いた https://pastebin.com/PiGMstfE
CFG Scalleを上げる、Denoising Strengthを若干下げる、tile width を64に下げる あたりが聞いてそうな感じがするがワイもこのへん適当や
なおtile widthの値を下げると生成時間が長くなる、この設定だと4090で6:46ほどかかっとる
https://fate.5ch.net/test/read.cgi/liveuranus/1679...
544:
>535やってみたで
背景プロンプトのみ+no humans denoise0.4
タグ全残し denoise0.4
たしかに小人出なくなったがキャラ属性が消えてしまうわな
その他
>524CNでイラストをある程度固定した方がいい
俺もハイレゾ化瞬間に崩れるのはモデルとprompt次第でよく見る
それでも崩れる時は崩れるけど・・・
Controlnetに追加された数々の機能の1つ、CNtileをMultiDiffusionと併用して高解像度にする
1. extensionsで sd-webui-controlnet をインストール
2. ControlNet 1.1のmodelをダウンロードし、\extensions\sd-webui-controlnet\models にセット
必要なのは control_v11f1e_sd15_tile.pth と control_v11f1e_sd15_tile.yaml
3. Controlnetを有効にし、プリプロセッサに tile_resample モデルに control_v11f1e_sd15_tile を選択
3. MultiDiffusion の設定を入れる
5. Generateクリックしてi2iでアップスケール実行
スレ207の868ニキ推奨設定
- メリット
- Denoising strengthを最大の1にしても小人さんが発生しない
- 元絵にほぼ忠実な状態で高解像度化が出来る
- デメリット
- 処理時間が数倍かかる(4k化に20分等)
1. extensionsで sd-webui-controlnet をインストール
2. ControlNet 1.1のmodelをダウンロードし、\extensions\sd-webui-controlnet\models にセット
必要なのは control_v11f1e_sd15_tile.pth と control_v11f1e_sd15_tile.yaml
3. Controlnetを有効にし、プリプロセッサに tile_resample モデルに control_v11f1e_sd15_tile を選択
3. MultiDiffusion の設定を入れる
5. Generateクリックしてi2iでアップスケール実行
スレ207の868ニキ推奨設定
868 名前:今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6312-keRw)[sage] 投稿日:2023/05/18(木) 14:49:53.98 ID:woSwpoup0 ニキ達、tile diffusionの公式見てないんか? Denoising strength0.5 ってのはもう昔の話やぞ 小人出さんように恐る恐るdenoise調整する時代はCNtileの登場で終わったんや 最新の推奨設定は ・Denoising strength1 (最大値ってことや) ・Method Mixture of Diffusers (デフォのmulti diffusionちゃうで) ・Noise Inversion Inversion steps200 (最大値や) ・Renoise strength0 (ゼロにしてええんや) ・CNtile使用 (タイル有効にしたら何もいじらん画像も貼らんでいい) これや
- Web|waifu2x - https://waifu2x.udp.jp/index.ja.html
- Windows|lltcggie/waifu2x-caffe: waifu2xのCaffe版 - https://github.com/lltcggie/waifu2x-caffe
- Windows|nagadomi/nunif: waifu2xの新モデルが使える - https://github.com/nagadomi/nunif/blob/master/waif...
いにしえ(2015年くらい)からあるアップスケーリングツール
でも今でも比較的良い結果が得られて十分使える(個人的見解)
PixSr4x - イラスト向け4倍超解像Windowsアプリケーション - https://kohya.devel.jp/pix_sr_4x/
LoRA用学習スクリプトでお世話になってる人も多いkohyaニキがむかし作ってたやつとのこと
LoRA用学習スクリプトでお世話になってる人も多いkohyaニキがむかし作ってたやつとのこと
コメントをかく