最終更新:ID:HFMkiui/CQ 2026年02月20日(金) 19:55:49履歴
ハローアスカベンチマーク(GPUごとの生成速度の一覧)はhelloasukaに移転しました
ここの情報は古くなっている場合があることに留意。
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択だ。
(2024/12/27追記)
ただしRTX4060に限りノート用LAPTOP版とデスクトップ用の性能差がほぼ無い。ノート用で機能制限されるのは4060のTDPだけなので消費電力が大きいゲーミングノートならデスクトップ版と差が出ない。
PCを一から買いそろえる際にゲーミングデスクトップにモニタや周辺機器を買いそろえるなら15万円前後で購入できる4060のゲーミングノートは一式そろっているので
スペースの問題などもあれば選択肢には入る。
ノート用では4070以上はデスクトップとの性能差が大きい割に価格も割高で置き場の問題などよっぽどの事情が無ければ推奨できない。
デスクトップPCを購入しモニタが無ければ最悪TVに繋いでも良いが
ただし生成AIでぶん回すとファンなどが高回転で回り続けるため相当五月蠅くなる。デスクトップの方が筐体サイズに余裕があるのでトレードオフになる。
ただ4060はVRAM8GB版しかないのでforge系列で基本的な生成がメインとなるので入門の入門なら悪くない。
(一旦追記終わり)
(仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いている)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おう(=もちろん90番台のグラボがベストな人もいるってこと)。
・中古グラボについて
RTX30シリーズの中古はマイニングで酷使されたものが多くおすすめできない。マイニング対策されたLHR版でさえもマイニングに使われていた場合もある。
(注)また、RTX 4090の動作不可や動作未確認ジャンク品(見た目は非常にきれい)はコアとVRAMが実装されていないものが出回っているため注意。中国への輸出規制で中国国内へチップが入荷できず実装できなかったものが基盤とクーラーだけで出回っている模様。動作確認していませんは基本的に詐欺。動かないものをもしかしたら動くかもと期待を持たせるための常套句。
どうしてもというのなら信頼できる友人知人や中古ショップでも保証が手厚いところから買うしか無いが中古をおすすめできる環境では無い
・AMDとIntelのGPUについて
個人向け生成AIではCUDAを利用できるNVIDIAのRTXシリーズ一強だったが2024年12月現在では他の選択肢も出てきてはいる
・AMD Radeonシリーズ
・Intel ARCシリーズ
(追記終わり)
RTX40シリーズ以降の補助電源コネクタは、異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき
PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。
基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。
RTX 3060 8GB以上を推奨。理由はFP16演算が速くbf16が使えるため。
ベンチマークの結果もGTXとRTXで3倍程度の壁が出来ている。
学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。
Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。MacはRAM32GB以上のM4 Pro搭載であれば快適に動く(電気代を気にする省電力派はMacがオススメ)。
ケチるんならGeForce RTX 20シリーズの中古。ただしRTX30以降のGPUと違いbf16が使えなかったり一部技術が非対応だったりする。
検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】
モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。SDXLの学習は最低でも32GB必要。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。
生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。
SD1の生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。SDXL以降は多分無理。
上位のGPUではCPUがボトルネックになる。
下位はSandy Bridgeでも動いてるがさすがに遅い。
よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。
GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるもの、Ryzen 7000シリーズ以降と末尾にFがついてないものがiGPUを搭載している。
GPUの性能が高いほどシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUのSD1の最大速度がわかる
1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。
バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHugging Face🤗が受け入れてくれる。※privateリポジトリは容量制限がある
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)
中華製品に抵抗がないなら、いわゆる「蝉族」がおすすめ。
生成はローカル、学習はクラウドという構成もアリ
ここの情報は古くなっている場合があることに留意。
- GPUの検証一覧(wiki内別ページ)
- ゲーミングノートパソコンは絶対に買うな
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択だ。
(2024/12/27追記)
ただしRTX4060に限りノート用LAPTOP版とデスクトップ用の性能差がほぼ無い。ノート用で機能制限されるのは4060のTDPだけなので消費電力が大きいゲーミングノートならデスクトップ版と差が出ない。
PCを一から買いそろえる際にゲーミングデスクトップにモニタや周辺機器を買いそろえるなら15万円前後で購入できる4060のゲーミングノートは一式そろっているので
スペースの問題などもあれば選択肢には入る。
ノート用では4070以上はデスクトップとの性能差が大きい割に価格も割高で置き場の問題などよっぽどの事情が無ければ推奨できない。
デスクトップPCを購入しモニタが無ければ最悪TVに繋いでも良いが
ただし生成AIでぶん回すとファンなどが高回転で回り続けるため相当五月蠅くなる。デスクトップの方が筐体サイズに余裕があるのでトレードオフになる。
ただ4060はVRAM8GB版しかないのでforge系列で基本的な生成がメインとなるので入門の入門なら悪くない。
(一旦追記終わり)
- 適当にRTX5090とか勧めるな
(仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いている)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おう(=もちろん90番台のグラボがベストな人もいるってこと)。
- 迷ったらVRAM12GB以上の最新のGeForceを買え
・中古グラボについて
RTX30シリーズの中古はマイニングで酷使されたものが多くおすすめできない。マイニング対策されたLHR版でさえもマイニングに使われていた場合もある。
(注)また、RTX 4090の動作不可や動作未確認ジャンク品(見た目は非常にきれい)はコアとVRAMが実装されていないものが出回っているため注意。中国への輸出規制で中国国内へチップが入荷できず実装できなかったものが基盤とクーラーだけで出回っている模様。動作確認していませんは基本的に詐欺。動かないものをもしかしたら動くかもと期待を持たせるための常套句。
どうしてもというのなら信頼できる友人知人や中古ショップでも保証が手厚いところから買うしか無いが中古をおすすめできる環境では無い
・AMDとIntelのGPUについて
個人向け生成AIではCUDAを利用できるNVIDIAのRTXシリーズ一強だったが2024年12月現在では他の選択肢も出てきてはいる
・AMD Radeonシリーズ
・Intel ARCシリーズ
(追記終わり)
RTX40シリーズ以降の補助電源コネクタは、異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき
PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。
パラメータ数がSD1と比較して約3倍(0.86B->2.6B)になった影響でメモリ(メインメモリとビデオメモリの両方)の使用量も3倍近く増えた。
よってRTX 3060(12GB)以上かつメインメモリ32GB以上がおすすめ。ちなみに、FP8かmedvramを利用するとVRAM消費が大幅に減って8GBでもすんなり動く。
よってRTX 3060(12GB)以上かつメインメモリ32GB以上がおすすめ。ちなみに、FP8かmedvramを利用するとVRAM消費が大幅に減って8GBでもすんなり動く。
基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。
RTX 3060 8GB以上を推奨。理由はFP16演算が速くbf16が使えるため。
ベンチマークの結果もGTXとRTXで3倍程度の壁が出来ている。
学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。
Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。MacはRAM32GB以上のM4 Pro搭載であれば快適に動く(電気代を気にする省電力派はMacがオススメ)。
ケチるんならGeForce RTX 20シリーズの中古。ただしRTX30以降のGPUと違いbf16が使えなかったり一部技術が非対応だったりする。
検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】
モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。SDXLの学習は最低でも32GB必要。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。
生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。
SD1の生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。SDXL以降は多分無理。
上位のGPUではCPUがボトルネックになる。
下位はSandy Bridgeでも動いてるがさすがに遅い。
よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。
GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるもの、Ryzen 7000シリーズ以降と末尾にFがついてないものがiGPUを搭載している。
GPUの性能が高いほどシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUのSD1の最大速度がわかる
1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。
バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHugging Face🤗が受け入れてくれる。※privateリポジトリは容量制限がある
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)
中華製品に抵抗がないなら、いわゆる「蝉族」がおすすめ。
生成はローカル、学習はクラウドという構成もアリ
- LoraとHNの学習結果は容量が少ないのでクラウドからダウンロードしやすい
- 学習中は生成もゲームも出来なくなるし電気代もかかるのでクラウド化は合理的
- GPU買う前にまず無料Colabを試してみよう ローカルの学習入門 ※現在動作するかは不明
このページへのコメント
Arc Bシリーズ(Aシリーズもそうかもだが試していない)、2025年4月辺りのドライバ以降、ドライバ更新後に起こる最初のstable diffusion処理が重くなる症状が改善(ほぼ無くなった)模様。(pytorch等は変更・更新していないので多分そうだと思う)
これでまた「ほんの僅かに」薦められる選択肢になったかもしれない。
Arc B580の続き、下のハロアスの生成時間はwindows版の速度(20.6s)です。(Linux/WSL2版/ubuntu版ではありません)
一応導入方法は、ここでは具体的なリンク場所等は明かせませんが、「stable diffusion b580」でぐぐると出てくるubuntu系の方がArcでのstable diffusionの各種導入方法を解説しているので、その中にあるwindows編のintel ARCでのstable-siffusionを動かすページに倣って導入したらForge+最新pytorch(v2.5.10+xpu)で動かせました。
ただし、同ページと違う所が2つあり、
・stable-diffusionのダウンロードがForge版のgit
・pytorchインストールが「v2.5.10+xpu」
にしたら無事動かせました。
全ての環境で動かせるという保証はありませんが、興味ある方は試してみてください。
ここに書き込むべきかどうか迷いましたが一応報告。(場違いなら申し訳ない)
Arc B580で stable diffusion forgeを動かせました。(使用したpytorchは最新のv2.5.10+xpu)。
速度はハローアスカベンチでは20.6s(16.5it/s)とかなり早く(某XL系ベンチでは1024x1024で28.8s(3.80it/s))、速度なら価格が倍以上のRTX4070に近い性能。
他の拡張機能等もGeForceと同じように快適に使えたので、「インストールできるなら」かなりのコスパを期待できそうです(既に1か月近く使っていますが、特に不安定さや使えない拡張機能等不便を感じる事はありませんでした)。
ただ、インストール後又はグラフィックドライバ更新後の最初の1枚はフォーマットみたいのがあるらしく、その1回のみ1分くらい掛かります(Radeonでもそうらしい、1回終われば電源落としても問題ありません)。
ただ、オススメかというと、インストールの難易度+各種トラブルシューティングの情報量を考えると、初心者は素直にGeForceにしたほうがいいとは思う。
ある程度仕組みが分かっている(インストール作業を調べながら数回した事ある)+ゲームあまりやらない方なら十分勧められる選択肢にはなっていると思います。(若しくはRadeon6xxxや7700以下を既に持っていて既にRadeonでstable diffusionを動かしている熟練者など)
3060(12G)¥40000-
すでに流通在庫のみかもだが、SDXLを生成するくらいなら何とか。
次がいきなり倍くらいの値段になってしまうので、これで妥協はありだと思う。
4060ti(16G)\70000-
3060より性能3割強up、メモリも増加。
コスパいいとは思うが、3060との価格差はやはり気になる。
4070(12G)\85000-
4060tiより性能2割upするもメモリ減少。
微妙。
4070ti(12G)\110000-
4070より性能2割up。メモリは据え置き。
微妙。
4070tis(16G)\130000-
4070tiより性能2割up、メモリも増加。
良いけど初心者がいきなりこれは高いと思うよね?
3060(12G)が頭一つ抜けて安い割にはそれなりにSDXL環境で生成できるから、画像生成にハマるかどうかもわからない初心者向けとしては、環境変わらず在庫あるうちは推奨したい。
他推奨は予算に合わせて4060tiと4070tis。
16Gあるので環境が進化してもついて行けると思う。
4070と4070tiは特売品を摘まめるならアリ。
ただし12Gなので、環境レース脱落は間近かもしれない。
今後の5060(16G)とかに期待したいけど、まあムリぽ。
3060生産終了みたいだし新規に奨める時代は終わった気がする
問題は次の推奨が何なのか