10. Q:トレーニングが開始されず、OOM /メモリ不足エラーが発生します。
A:GPUがサポートされていないか、DFLバージョンが間違っているか、VRAMが不足しています。
1. GPUに適切なバージョンのDFLをダウンロードしたことを確認します。
- CUDA10.1SSEまたはAVXをサポートするNvidia GTX GPUおよびCPU
- Nvidia GTX / RTX GPUおよびAVXをサポートするCPU
向けのCUDA10.1AVX-AMDおよびIntel GPU向けのOpenCLSSE
2. GPUがサポートされているかどうかを確認します。 3.5のコンピューティング機能:
https://en.wikipedia.org/wiki/CUDA#GPUs_supported
3. OOMエラーが表示される場合、VRAMが不足していることを意味します。一部のモデルでは、それを修正するために変更できるさまざまな設定があります。 :
a)バッチサイズを小さくする(すべてのモデル)
- バッチサイズを小さくすると、モデルがメモリに同時に読み込む画像が少なくなるため、使用する画像の量は少なくなりますが、同じ結果を得るには、より高いバッチよりも長くトレーニングする必要があります
- サイズ、2-4のような非常に低いバッチサイズもモデルの精度を低下させる可能性がありますが、これは単なる推測であり、100%が真であるとは確認されていません。
b)異なるオプティマイザーモード(SAE / SAEHD)を使用する
- モード2および3はRAMを使用して、トレーニング速度を犠牲にしてGPU VRAMからデータの一部をオフロードします
c)スタイルパワー(SAE / SAEHD)を使用しない
- 有効化それらは反復/トレーニング時間を増やし、より多くのvramを使用します。実行に問題があるが、バッチサイズを小さくしたくない場合は、0に設定します。
d)ピクセル損失(SAE)を使用しないでください
- ピクセル損失のパフォーマンスヒットはわずかです。VRAMが不足したりOOMエラーを取得したりする場合は、無効にしてみてください。
e)学習済みマスク(SAE / SAEHD)を使用しない
- トレーニング中にマスクを学習すると、VRAMの使用が増加し、トレーニングが遅くなり、反復時間が長くなります。
f)トゥルーフェイストレーニング(SAEHD)をオフにする
- トゥルーフェイスはVRAMの使用量を増やし、トレーニングを遅くしたり、反復時間を増やしたりします。
これらの2つの設定は、新しいモデルを作成する場合にのみ後で変更できないことに注意してください:
g)解像度を下げてモデルを実行します
- 実行できるすべての最適化や、まだできないさまざまな機能を無効にしても目的の解像度を実行するには、実行できるまで(16倍)下げるだけです。
h)autoencoderおよびencoder / decoder_chの寸法を小さくします(推奨されません)-これらを小さくすると、追加の機能/高解像度モデルを実行できますが、精度が犠牲になります。
エラーが発生した場合は、PCを再起動してください。
11. Q:GPUはサポートされています。バッチサイズを小さく設定し、適切なDFLバージョンを使用していますが、それでもエラーが発生します。
A:ドライバー(GPU)の問題があるか、モデルが壊れているか、使用しているDFLのバージョンと互換性がないか、データセット(data_srcおよびdata_dst)が壊れている/互換性がない/欠落しています。
1.別のモデルまたは新しいモデルを使用してみてください(モデルフォルダーからモデルファイルをバックアップし、それらを削除して新しいモデルでやり直します)。
それでもエラーが修正されない場合は、データセットに問題がある可能性があります
別のソフトウェアで抽出されたファイルまたはデータセットが欠落しています。
Googleまたはフォーラムの検索機能を使用して、そのエラーの一部を見つけてください。
誰かがすでにそれについて投稿している可能性があります。
そうでない場合は、DFL githubページに移動して報告するか、解決策を探してください
そこで:
https://github.com/iperov/DeepFaceLab
2.すべてを実行してもまだエラーが発生する場合は、PCを再起動して再試行してください。
3.まだ何もですか?フォーラム、Google、GitHubを確認しても何も見つかりませんでしたか?ドライバーやcudaなどの問題を確認してください。
どれも違いがない場合は、新しいスレッドを作成できます(またはgithubページでバグを報告します)。