顔入替ソフトのインストール方法、使用例、How to、TIPS、FAQ等です

DFL-使用方法のチュートリアル


ガイドは修正中または更新中です。すぐに更新される予定です。

DFLとは何ですか?

DFLは、機械学習を利用してビデオの顔を交換するツール/アプリです。

DFLは 、AMD、NVIDIA、IntelHDグラフィックス、および少なくとも256Mのビデオメモリを搭載したすべてのOpenCL 1.2互換ビデオカードと互換性があります。

注:より良い結果を得るには、2GB + vRAMを搭載したNVIDIAまたはAMD GPUをお勧めします。使用可能なメモリが多いほど、結果の品質が向上します。

GitHubはここにあります(最新バージョンと現在のすべてのアップデートが含まれています):
DeepFaceLab_CUDA -GTX / RTX NVIDIAグラフィックスカード用
DeepFaceLab_OpenCL -AMD / IntelHDグラフィックスカード用

機能:

すべてのWindowsバージョンに依存関係のないスタンドアロンアプリとして利用可能。
さまざまなモデル(H64、H128、DF、LIAEF128、SAE、SAEHD、AVATAR)が含まれています。

使いやすい。
GT730などの2GBの古いカードで動作します。18時間で2GBのgtx850mノートブックでトレーニングされたディープフェイクの例

顔画像ファイルに埋め込まれた顔のランドマーク/位置データ。個別のランドマークファイルはありません。

最高のGPUの自動選択。
トレーニングプレビューウィンドウ。
インタラクティブなコンバーター。
ソースおよび宛先(data_src / dst)データセットのデバッグ(顔ランドマークプレビュー)オプション。
S3FDと手動抽出を利用した自動顔抽出。
16単位の任意の解像度でトレーニング。最適化設定(オプティマイザーモード)により、最大256の解像度でモデルをトレーニングできます。

すべてのDFL機能の説明:

DFLは、ディープフェイクの作成プロセスで必要なさまざまなモデル、抽出、および変換を実行するために使用される.batファイルの選択で構成され、
2つのサブフォルダーとともにメインフォルダーにあります。

_internal(DFL操作に必要なすべてのモデル/コンバーターおよびその他のファイルがある場所)
ワークスペース(モデル、ビデオ、データセット、最終的なディープフェイク出力がある場所)
オプションは、実行する機能に基づいてグループ化されます。これらを実行するときに選択するさまざまなオプションがあります。スキップ-Enter。

1.ワークスペースのクリーンアップ/削除:

1)ワークスペースのクリア
  • 自明です。「ワークスペース」フォルダーに保存されているデータセット、モデル、ビデオなどのすべてのデータを削除します。
誤って削除しないように削除することをお勧めします。

2.2) extract images from video data_src.bat

2)ビデオdata_srcから画像を抽出
  • data_src.mp4ビデオファイルを個々のフレームに切り取り、自動的に作成された「data_src」フォルダーに入れます。
利用可能なオプション:-FPS-
ビデオのデフォルトをスキップフレームレート、他のフレームレートの数値を入力します(たとえば、5を入力すると、1秒あたり5フレームでビデオがレンダリングされるため、抽出される画像が少なくなります)
  • JPG / PNG-抽出されたフレームの形式を選択します。jpgはサイズが小さく、一般的に品質が良いため推奨されます。pngは大きいですが、特定の状況で優先される場合があります

ビデオの切断

3.1) cut video (drop video on me).bat-ビデオを.batファイルにドロップすることで、ビデオを目的の長さにすばやくカットできます。
ビデオ編集ソフトウェアがなく、ビデオをすばやくカットしたい場合に便利です。
オプション:
開始時間-ビデオの開始
終了時間- ビデオの終了
オーディオトラック-デフォルトのままにします
ビットレート-デフォルト3.2のままにします

dstビデオからのフレーム抽出(data_dst.mp4)

3.2) extract images from video data_dst FULL FPS.bat-data_dst.mp4ビデオファイルを個々のフレームに切り取り、自動的に作成された「data_dst」フォルダーに配置します。
利用可能なオプション:-JPG/ PNG)

4. Data_srcの準備


ソースデータセットを準備する最初の段階は、ランドマークを揃え、「data_src」フォルダー内にある抽出されたフレームから256x256の顔画像を作成することです。

自動抽出方法:
  • S3FD抽出:MT抽出と比較して、誤検出が少なく正確です。おそらく少し滑らかです。もっとゆっくり。推奨。

これはプレビューGUIを使用し、誤検出/正しく配置されていない面を手動で修正するために使用されます。
以下から選択するオプション:
4) data_src extract faces MANUAL.bat-手動抽出。短いdata_dst.mp4があり、それらをすべて手作業で調整する場合にのみ使用します。
4) data_src extract faces S3FD all GPU debug.bat
4) data_src extract faces S3FD all GPU.bat
4) data_src extract faces S3FD best GPU.bat
2つの抽出整列していない面がファイルとAVATAR再演/人形モデルで訓練するデータセットを準備するため、これらの.batファイルもあります。
4) data_src mark faces S3FD all GPU (avatar only).bat
4) data_src mark faces S3FD best GPU (avatar only).bat


すべてのGPUは、互換性のあるすべてのGPUを使用しようとすることを意味します。
デバッグは、顔に付けられたランドマークを見てアライメントを確認できる「aligned_debug」フォルダーを自動的に作成します。
すでに顔を揃えた後にそのフォルダーを作成する場合は、次を実行できます:4.2.other)data_src util add addmarks debug images

4.1-4.2.other Data_src cleanup:

完了後、次のステップは誤検知 /誤ってデータセットを消去することです

最初に次のものがあります:

4.1)data_srcチェック結果-外部アプリを開き、data_src / alignedフォルダーの内容をすばやく確認して、誤検出や誤って配置されたソースの顔画像を削除できるようにします。
次に、悪い顔の画像を見つけて削除するのに役立つさまざまな並べ替えアルゴリズムがあります

4.2.1) data_src sort by blur.bat-ぼかしによる並べ替え(画像内のコントラスト)
4.2.2) data_src sort by similar histogram.bat-類似画像による並べ替え、個々の人と悪いイメージを整理するのに適しています。
4.2.4) data_src sort by dissimilar face.bat-ランドマークに基づく
4.2.4) data_src sort by dissimilar histogram.bat-逆順を除いて同様のヒストグラムと同じ
4.2.5) data_src sort by face pitch.bat-ピッチによる(顔を見上げて/下へ) )
4.2.5)data_src顔による並べ替えヨー-ヨーによる並べ替え(顔が左/右に見える)
4.2.6) data_src sort by best.bat-(後で更新されます)
4.2.other) data_src sort by black.bat-顔がカットオフの場合、純粋な黒バーが表示されます、これがソートするもの、リストの最後にさらに黒いバー
4.2.other) data_src sort by brightness.bat-輝度
4.2.other) data_src sort by hue.bat-色相/色で
4.2.other) data_src sort by one face in image.bat-元々フレーム内に1人しかいない画像で、フレーム内にさらに人がいる場合は、リストの最後になります
4.2.other) data_src sort by original filename.bat-元の順序に戻ります/ filename
4.2.other) data_src sort by vggface.bat-「類似のヒストグラムによる」並べ替えアルゴリズムとは異なり、遅い
4.2.other) data_src util recover original filename.bat-元の順序/ファイル名に

戻す4.2.otherさらにData_srcのクリーンアップとアライメントのチェック:

4.2.other) data_src util add landmarks debug images.bat-「data_src」内に「aligned_debug」フォルダーを作成します。 「aligned」フォルダー内で見たとき、または4.1)data_src check result

4.3 Data_src enhacements:

FacesetEnhance-Upscaling(Gigapixelに類似)より良い品質のためにソースデータセットを強化するには、GPUおよびCPU(OpenCLのCPU)で実行します。

4.2.other) data_src util faceset enhance best GPU.bat
4.2.other) data_src util faceset enhance multi GPU.bat

リライト-すべてのソースマテリアルが正面/均一に照らされている場合、モデルに影をより良く学習/学習させるために、顔に人工的な影を追加します

4.3) data_src add relighted faces.bat-影が追加された新しい顔を生成します(プレビューウィンドウで指定できます)実行すると開きます)。
4.3) data_src delete relighted faces.bat-新しい生成された面を削除します

FaceRelighterは削除されたようです。少なくともしばらくの間、iperovから情報を取得すると更新されます。

5. Data_dstの準備:


ここでの手順は、ソースデータセットの場合とほとんど同じですが、例外はほとんどありません。顔画像の位置合わせ/ランドマークプロセスから始めましょう。
ここには、手動、MT、およびS3FDの抽出方法もあります。今回は、「aligned_debug」フォルダーが常にdata_dst処理で作成されるため、デバッグなしです

5) data_dst extract faces MANUAL.bat
5) data_dst extract faces S3FD all GPU.bat
5) data_dst extract faces S3FD best GPU.bat

、基本的に自動アライメントを実行する「+手動修正」バリアントがあり、終了後、プレビューが開き、それらのランドマーク/アライメントを手動で修正できます。
5) data_dst extract faces S3FD all GPU + manual fix.bat
5) data_dst extract faces S3FD best GPU + manual fix.bat

また、2つの非整列顔.batファイルの抽出があり、srcのマーク顔に似たファイルは、AVATAR再現/人形モデルでトレーニングするデータセットを準備するためのものです。
5) data_dst extract unaligned faces S3FD all GPU (avatar only).bat
5) data_dst extract unaligned faces S3FD best GPU (avatar only).bat
5.1-5.3。その他のData_dstクリーンアップ:

data_dstフレームから顔を整列した後、それらをクリーンアップする必要がありますソースデータセットをどのように使用したかについては、srcの場合とまったく同じように機能するため、説明しません。
ただし、dstデータセットのクリーンアップはソースとは異なります。これは、存在するすべてのフレームに対してすべての面を整列させるためです。

それが、5) data_dst extract faces MANUAL、削除された結果のデバッグ、5.1)data_dstのチェック結果のデバッグに直面していることです。

要するに、ヒストグラムでソートを実行して顔をグループ化し、他の人のすべての偽陽性と顔を削除するだけでなく、すべて間違って整列された顔(基本的に、回転、非常にズームイン/アウト、または切り取られた顔)。
その後、エクストラクタが見逃した可能性のあるいくつかの顔がまだ残っている可能性があるため、
5.1) data_dst view aligned_debug resultsを使用して、ランドマークを見て悪いアライメントをさらに検索し、ランドマークのない顔を探して、それらをすべて選択して削除する必要があります

最後に実行5) data_dst extract faces MANUAL RE-EXTRACT DELETED ALIGNED_DEBUGは、手動の再抽出、削除された結果のデバッグに直面します。
これは、「aligned_debug」をスキャンして欠落しているイメージをスキャンし、それらを手動で位置合わせ/ランドマークできます。
最後に、5.1)data_dstチェック結果を実行して、data_dst / alignedフォルダをすばやく調べて、すべての面が正しく配置されているかどうかを確認することもできます。
5.4 Data_dstの機能強化:

ソースと同様に、リライトを使用してシャドウを生成し、正面のみ/均一に照明された顔でシャドウをトレーニングできます:

リライト- 顔に人工シャドウを追加して、モデルがすべてのソースマテリアルのシャドウをトレーニング/学習できるようにします正面/一様に点灯している

5.4) data_dst add relighted faces.bat -あなたは)あなたがそれを実行したときに開くことプレビューウィンドウでそれを指定することができます(追加の影で新しい顔を生成します。
5.4) data_dst delete relighted faces.bat-新しい生成された面を削除します

FaceRelighterは削除されたようです。少なくともしばらくの間、iperovから情報を取得すると更新されます。

5.その他の高度なマスクエディター:
data_dstに揃えられた顔のマスクを手動で編集できます(そのため、顔の一部をトレーニングから除外し、最終画像を変換してその場所の元の顔を表示するときにもこのマスクを使用できます)。
編集されたマスクトレーニング+マージの結果(dstマスクを使用した変換): 非常に退屈で時間のかかるプロセスです。
代わりに、ディープフェイクの障害物を取り除きたい場合は、マージ/変換中にFANsegマスクを試してください。

FANseg変換:
コンバーター(または推奨されるインタラクティブコンバーター)では、fan-prd、fan-dst、fan-prd*fan-dst、learned*fan-prd*fan-dstなどのさまざまなマスクモードを選択して、自動的に使用できます
顔(メガネ、data_dstの顔を覆っている/邪魔している手など)の障害物をマスクします。これらのマスクは、この部分をマスクし、下の画像のようにそのスポットに元のフレームを表示します。

モデルタイプ:

H64(2GB +): 64x64の顔解像度。 TensorFlow 1.8 DSSIM Loss関数と分離マスクデコーダー、およびより優れたConverterMaskedを使用します。
2GBおよび3GBのVRAMモデルは縮小モードで動作します。これは、まっすぐな正面のシーンにも適したオプションです。

H128(3GB +): 上記と同じ。ただし、解像度は128x128に改善されており、顔の詳細が保存され、より高い解像度のビデオやクローズアップショットでパフォーマンスが向上します。
3GBおよび4GBのVRAMモデルは縮小モードで動作します。直接顔を向けるシーンにも最適で、最高の解像度と詳細を提供します。
アジア人の顔には、比較的平らな顔と、透明な肌にさえ照明があるため、最適なオプションです。


(5 + GB): dfakerモデル。フルフェイスモデルで128x128の解像度があります。
このモデルを使用する場合、異なる照明条件でsrc面を混在させないことをお勧めします。
側面に最適ですが、解像度とディテールが低くなります。
このモデルは、多くの場合拡大し、頬のより多くの領域をカバーする、より「完全な」顔をカバーします。
顔のモーフィングを維持し、説得力のある顔の入れ替えを行います。
ただし、dst面は同様の形状にする必要があります。


LIAEF(5GB +): DF、IAE、および実験を組み合わせた新しいモデル。
このモデルは、srcの顔の特徴を維持しながらsrcの顔をdstにモーフィングしようとしますが、モルヒネはそれほど攻撃的ではありません。
このモデルには、閉じた目の認識に問題があります。
このモデルは、異なる顔の形を部分的に修正できますが、顔の認識が難しくなります。


AVATAR(4GB +):非GAN、256x256フェイスコントロールモデル。


SAE(2GB +): スタイル付きオートエンコーダー。
以前の「スーペリア」モデルは、ハーフフェイスモードおよびフルフェイスモードで実行でき、DFおよびLIAEアーキテクチャ+スタイルパワー(スタイル転送)を使用できます。
重いだけでなく、改良されたSAEHDモデルも実行できない場合、これはまだ良い選択です。
また、TrueFace、Random Warp、lr_dropoutなどのSAEHDの機能を追加する、SAE + modが積極的に更新されています。


SAEHD(6GB +): High Definition Styled AutoEncoder-SAEの新しく改良されたバージョン。SAEよりも実行がはるかに重いですが、さらに優れた品質を提供します。

新しい機能には、より安定した顔とより少ないジッターを生成する新しいエンコーダー、よりきれいなサブピクセル結果を生成する新しいデコーダー、
ピクセル損失とdssim損失が一緒に統合されて、トレーニング速度とピクセルの真実性の両方を達成します、デフォルトではネットワークはCAウェイトで初期化されます、
新しいニューラルネットワークオプティマイザーが消費するVRAMが少なく、エンコーダーとデコーダーの調光が1つのパラメーターエンコーダー/デコーダーの調光にマージされ、
半分の顔よりも30%多くの面積をカバーする新しいミッドフルフェイスモードが含まれます。
その他の注目すべき新機能:True Face、ランダムワープ、トレーニング中のlr_dropoutおよびその他のカラー転送モード(rct、lct、mkl、idt、sot)。


ガイドは修正 /更新されています。すぐに更新を期待してください。

外部リンク




寄付(任意)について

Amazon.jpギフト券での寄付は受け付けています
  1. AmazonでE-Mailタイプのギフト券を購入(金額は任意)
  2. 自分のアカウントに登録はしない
  3. 下記メールアドレスにAmazonギフト券番号を記載し、通知
  4. tomoe.magica@gmail.com


Seesaa Wiki関連リンク

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

どなたでも編集できます