編集日時:2023年05月24日(水) 09:31:49履歴
ハローアスカベンチマーク(GPUごとの生成速度の一覧)はhelloasukaに移転しました
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択や。
(ワイは仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いてるで)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おうな(=もちろん90番台のグラボがベストなニキもいるってことや)。
もちろんゲームもFHDなら快適やで。
補助電源コネクタの異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき
torch1系の場合、cudnnライブラリの更新をしないと速度が出ないっぽい。
ローカル高速化メモ
PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。
基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。
RTX 2060 6GB以上を推奨。理由はFP16演算が速いから。
ベンチマークの結果もここで3倍程度の壁が出来ている。
将来的にTensorRTによる高速化もありうる、かも。
学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。
Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。
ケチるんならGeForce GTX 1000番台の中古。ただしRTX系のGPUより数倍遅いし、学習も厳しい。
ちなみにGeForce GTX 600番台(一部の780番等も該当)のKeplerやそれ以前のFermi世代はCUDAがサポート対象外で、LinuxでTorchを手動でビルド(エラーが発生しやすい)しないと使えないので注意。(誰もいないとは思うが...)
検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】
モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。
生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。
生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。
上位ではCPUがボトルネックになる。
下位はSandyおじさんでも動いてるが多少遅い。DDR3世代だから?
推定12it/sまでは出せるのでGPUの性能ぎりぎり間に合ってるけど、次の生成開始に時間がかかってるのかも。
よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。
GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるものとRyzen 7000シリーズがiGPUを搭載している。
処理速度が18it/s以下ではほとんど影響しないが、18it/sを超えたあたりから急激にシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUの最大速度がわかる
1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。
バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHuggingFace🤗が受け入れてくれる。
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)
個人輸入、保証なし、超高額(960GBが6万円!!)、AMD環境で動作しないのでおすすめしないが、Intel製SSDのOptane 905pもアリかも。
異次元の10000TBを超える耐久性があり、何をしても性能が下がらないので激しい書き込みをする用途にうってつけ。
生成はローカル、学習はクラウドという構成もアリ
- GPUの検証一覧(wiki内別ページ)
- ゲーミングノートパソコンは絶対に買うな
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択や。
- 脳死でRTX4090とか勧めるな
(ワイは仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いてるで)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おうな(=もちろん90番台のグラボがベストなニキもいるってことや)。
- 迷ったらRTX 3060を買え
もちろんゲームもFHDなら快適やで。
補助電源コネクタの異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき
torch1系の場合、cudnnライブラリの更新をしないと速度が出ないっぽい。
ローカル高速化メモ
PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。
基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。
RTX 2060 6GB以上を推奨。理由はFP16演算が速いから。
ベンチマークの結果もここで3倍程度の壁が出来ている。
将来的にTensorRTによる高速化もありうる、かも。
学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。
Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。
ケチるんならGeForce GTX 1000番台の中古。ただしRTX系のGPUより数倍遅いし、学習も厳しい。
ちなみにGeForce GTX 600番台(一部の780番等も該当)のKeplerやそれ以前のFermi世代はCUDAがサポート対象外で、LinuxでTorchを手動でビルド(エラーが発生しやすい)しないと使えないので注意。(誰もいないとは思うが...)
検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】
モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。
生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。
生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。
上位ではCPUがボトルネックになる。
下位はSandyおじさんでも動いてるが多少遅い。DDR3世代だから?
推定12it/sまでは出せるのでGPUの性能ぎりぎり間に合ってるけど、次の生成開始に時間がかかってるのかも。
よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。
GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるものとRyzen 7000シリーズがiGPUを搭載している。
処理速度が18it/s以下ではほとんど影響しないが、18it/sを超えたあたりから急激にシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUの最大速度がわかる
1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。
バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHuggingFace🤗が受け入れてくれる。
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)
個人輸入、保証なし、超高額(960GBが6万円!!)、AMD環境で動作しないのでおすすめしないが、Intel製SSDのOptane 905pもアリかも。
異次元の10000TBを超える耐久性があり、何をしても性能が下がらないので激しい書き込みをする用途にうってつけ。
生成はローカル、学習はクラウドという構成もアリ
- LoraとHNの学習結果は容量が少ないのでクラウドからダウンロードしやすい
- 学習中は生成もゲームも出来なくなるし電気代もかかるのでクラウド化は合理的
- GPU買う前にまず無料Colabを試してみよう ローカルの学習入門