NovelAI 5ch Wiki

画像生成AIの情報を纏めるWikiです。

ハローカエル

学習ベンチマーク
結果

学習ベンチマーク

https://note.com/kohya_ss/n/nb20c5187e15a これで比べる
https://huggingface.co/aka7774/frog_bench バッチを用意した

accelerate launchの実行時間を測る。
Windowsだとちょっと大変。
Linuxだと頭にtimeをつければ出てくる。

バッチの時間が変だったら100%になった時の所要時間も併記してくれるといいかも・・・。
環境によるけど30秒から1分くらいの準備時間が別途かかってるはず。

厳密にレギュレーションに従うなら tag v0.4.0(サンプル用意時) で計測するのがお勧め。

結果

GPU	VRAM	CPU	time(秒)	オプション	バージョン	備考	編集
ARC A750	8GB	Ryzen9 5900X	37m	8bit系オプティマイザ使えないのでAdamW、batch_size=2--xformersなし --mem_eff_attn --cache_latents	sdxlブランチ1e395ed285385a17b39f3190b330220d29bde0ba	sdxlブランチのARC対応版をWSL2で torch==2.0.1a0+cxx11.abi torchvision==0.15.2a0+cxx11.abi intel_extension_for_pytorch==2.0.110+xpu -f https://developer.intel.com/ipex-whl-stable-xpu tensorboard==2.12.3 tensorflow==2.12.0 intel-extension-for-tensorflow[gpu]をpip install	編集
RTX 3090	24GB	Ryzen9 5950X	2m38.367s	--xformers --batch_size 4	0cfcb5a49cf813547d728101cc05edf1a9b7d06c	torch:2.0.1 xformers:0.0.20 Ubuntu:22.04 Python:3.10.6 3090を2つ使った場合 accelerate configでmulti-gpuを選択	編集
RTX 3090	24GB	Ryzen9 5950X	4m31.047s	--xformers --batch_size 4	0cfcb5a49cf813547d728101cc05edf1a9b7d06c	torch:2.0.1 xformers:0.0.20 Ubuntu:22.04 Python:3.10.6 PyTorch1系&xformers0.0.16だとlossがnanになる	編集
RX 6650XT	8GB	Ryzen 5 5600G	18m6.079s	--sdpa --cache_latents --gradient_checkpoint export PYTORCH_HIP_ALLOC_CONF='garbage_collection_threshold:0.8,max_split_size_mb:256'	449ad7502cb0f36cd8b94b2c7d98ec204af234a9	torch: 2.0.1+rocm5.4.2 bitsandbytes-rocm3.7 origin/original-u-net	編集
RX 6650XT	8GB	Ryzen 5 5600G	15m49.325s	--sdpa --train_batch_size=1 --cache_latents	449ad7502cb0f36cd8b94b2c7d98ec204af234a9	torch:2.0.1+rocm5.4.2 bitsandbytes-rocm3.7 origin/original-u-net	編集
RTX 2070 SUPER	8GB	Ryzen 7 5800X	7m24.127s	--xformers --batch_size 2 --cache_latents		torch2.1,xformers0.0.19 cache_latentsオンで低解像度で大幅に高速化	編集
RTX 2060	6GB	Ryzen 5600X	18m15.98s	--xformers batch_size=2			編集
RX 6650 XT	8GB	Ryzen 5 5600G	24m18.670s	--mem_eff_attn --max_data_loader_n_workers=8 --num_cpu_threads_per_process 12	5050971ac687dca70ba0486a583d283e8ae324e2	torch: 2.0.0+rocm5.4.2 Ubuntu20.04 python3.10 bitsandbytes-rocm3.7 画面出力iGPU	編集
RTX 2070 SUPER	8GB	Ryzen 7 5800X	12m16.307s	--xformers batch_size=3		torch2.1,xformers0.17	編集
RX 6900 XT	16GB	Ryzen 5950X	11m32.561s	--xformersなし --mem_eff_attn追加環境変数'PYTORCH_HIP_ALLOC_CONF='garbage_collection_threshold:0.9,max_split_size_mb:512''		tensorflow-rocmとbitsandbytes-rocm(本家のissue#107にリンクあり)を使用する。bitsandbytesのモジュールは自動でビルドされないので、別にクローンしてビルドし、出来たものを'venv/lib/python3.10/site-packages/bitsandbytes/'に入れる。	編集
RTX 3060	12GB	Ryzen 3700X	25m2.20s		71b728d5fcfe16f4434e2bf61e75cdfb76f93e14	16h25m2.20s ってテキストには書いてあった Windows11 pro	編集
RTX 3080Ti	12GB	i7 11700F	6m10.22s				編集
GTX 1080Ti	11GB	i9 9900K	27m27.76s		08ae46b	事前にbitsandbytesのGTX10シリーズ対応を実施済み	編集
RTX 2070	8GB	Ryzen 1700X	15m26.935s	batch_size=3 use-8bit-adamなし gradient_checkpointing	08ae46b	WSL2	編集
GTX 1660	6GB	i5 12400	1h17m40.38s	batch_size=1 mixed_precision=no gradient_checkpointing	7c1cf7f4eaf011e3c90e163049f85bdbadb75ef2	GetStartTimeラベルだけ認識されないのでサブルーチンを前に持ってきた Windows11	編集
							編集

このページを編集するこのページを元に新規ページを作成

印刷する

コメント（0）

カテゴリ：
漫画/アニメ
総合

hellofrog - NovelAI 5ch Wiki 先頭へ

コメントをかく

名前	ユーザIDを使用しないで書き込む	ユーザーIDを使う	ログインする
備考	「http://」を含む投稿は禁止されています。
本文
利用規約をご確認のうえご記入下さい

Menu

はじめに

技術解説・ツール紹介

プロンプトテクニック

部活動

Prompts

非R18詠唱全文

版権キャラ再現

編集中メニュー

R18系Prompts

R18作品公開

R18詠唱呪文あり・呪文なし

R18プロンプト作例

R18単語集

単語集

過去ページ（引っ越し中）

ローカル部

Automatic1111関連

ローカルの学習

画像の再現性

なんJnovelAI部過去ログ

Wiki

【メニュー編集】

最近更新されたスレッド

2024-07-24
- その他雑談など(524)
2024-07-20
- うちの子自慢部(31)
2024-07-17
- 触手好きに聞きたい(1)
2024-07-12
- 助言、求む(1)
- この画像の絵柄の生成方法を教えてほしい(11)

最近更新したページ

最新コメント

2024-07-26
画風・構図 by 名無し(ID:02HDuG6x5w)
版権キャラ再現/アイドルマスター系 by 匿名
トップページ by 名無し(ID:do6Cmrj+1Q)
2024-07-25
版権キャラ再現/あ行 by 名無し(ID:1MCHn8LSOw)
2024-07-23
版権スタイル by 名無し(ID:02HDuG6x5w)
トップページ by 名無し(ID:7ej+2T29Iw)
トップページ by 名無し(ID:wAq28zfdOw)
2024-07-22
セックス(2人) by 名無し(ID:1MCHn8LSOw)
版権スタイル by 名無し(ID:WNWKlHbPWQ)
セックス(2人) by 名無し(ID:BzXUGMHtpA)

QRコード

table拡張js

アクセス解析中

どなたでも編集できます

メンバー募集！