NovelAI 5ch Wiki - ローカル部 PCスペック相談室
ハローアスカベンチマーク(GPUごとの生成速度の一覧)はhelloasukaに移転しました


はじめに

  • ゲーミングノートパソコンは絶対に買うな
ノーパソ用はでかいPC用のグラボと型番がすごい似てたりするけど性能は全然違うで。
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択や。
  • 脳死でRTX4090とか勧めるな
PC触ったことないやつが何十万もするグラボ買うのは常識的ではないで。5万円の3060はまだしも30万円の4090を素人に勧めるのはおかしいと思う。
(ワイは仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いてるで)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おうな(=もちろん90番台のグラボがベストなニキもいるってことや)。
  • 迷ったらRTX 3060 12GBを買え
万人向けのGPU。5万円程で比較的安価ながら、12GBのメモリを搭載していてそこそこの性能でAI用途ではコスパ最高。
もちろんゲームもFHDなら快適やで。

注意

RTX40シリーズの注意事項


補助電源コネクタの異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき

torch1系の場合、cudnnライブラリの更新をしないと速度が出ないっぽい。現在はTorch2が主流のため気にする必要はない。
ローカル高速化メモ

メーカー・モデルによる差異


PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。

SDXLについて

パラメータ数が約3倍になった影響でメモリ(メインメモリとビデオメモリの両方)の使用量も3倍近く増えた。
よってRTX 3060(12GB)以上かつメインメモリ32GB以上がおすすめ。ちなみに、FP8を利用するとVRAM消費が大幅に減って8GBでもまあまあ動く。

パーツ評

GPU


基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。

RTX 2060 6GB以上を推奨。理由はFP16演算が速いから。
ベンチマークの結果もここで3倍程度の壁が出来ている。

学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。

Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。
ケチるんならGeForce GTX 1000番台の中古。ただしRTX系のGPUより数倍遅いし、学習も厳しい。

ちなみにGeForce GTX 600番台(一部の780番等も該当)のKeplerやそれ以前のFermi世代はCUDAがサポート対象外で、LinuxでTorchを手動でビルド(エラーが発生しやすい)しないと使えないので注意。(誰もいないとは思うが...)

検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】

RAM(メインメモリ)


モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。SDXLの学習は最低でも32GB必要。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。

生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。

生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。

CPU


上位のGPUではCPUがボトルネックになる。
下位はSandyおじさんでも動いてるが多少遅い。DDR3世代だから?
推定12it/sまでは出せるのでGPUの性能ぎりぎり間に合ってるけど、次の生成開始に時間がかかってるのかも。

よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。

GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるものとRyzen 7000シリーズがiGPUを搭載している。

GPUの性能が高いほどシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUの最大速度がわかる

ストレージ


1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。

バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHuggingFace🤗が受け入れてくれる。
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)

中華製品に抵抗がないなら、モンスターストレージが販売しているSSDがおすすめ。タイムセールで2TB,7450MB/sのSSDが1.3万円になってたりする。
AmazonとYahoo!ショッピングで販売中。

OS


ガチでやるならLinuxは良い。
Windowsで普段使いするならWSL2も良い。
なお、Linuxだからといって速くなるとは限らない。

クラウドとの併用


生成はローカル、学習はクラウドという構成もアリ
  • LoraとHNの学習結果は容量が少ないのでクラウドからダウンロードしやすい
  • 学習中は生成もゲームも出来なくなるし電気代もかかるのでクラウド化は合理的
  • GPU買う前にまず無料Colabを試してみよう ローカルの学習入門

実際の所どれ買えばいいの?

A. お前の予算が許す限りのNVIDIAの上位モデルを買え


VRAM搭載量の違いから選択


現行モデル


現在おすすめできないグラボ

A. どれを買うかで迷ってるなら3060 12GBを買え

A. 3050 8GBを検討?

VRAM6GBのモデルに置き換えられた。6GBではSD1.5が精一杯でSDXLと重量級ゲームは厳しい。
3060(12GB)か4060(8GB)を買いましょう。

A. 学習するかどうかから考えて買え

中古のグラボ買っても大丈夫?

ゲーミングノートパソコンをお勧めできない理由

中古の1000番台なら

ローエンドGPUのVRAMと画像サイズ