複数のモデル、VAEで速度を計測したが誤差の範囲でしか変わらんかった。
masterpiece, best quality,
Negative prompt: lowres, low quality, bad anatomy, signature
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 11, Size: 512x512, Clip skip: 2, ENSD: 31337
Batch size 2, Batch count 5
None:22.69s,21.73s
kl-f8-anime2.pt:21.40s,21.72s
kl-f8-anime2(fp16化):21.38s,21.70s
novelai:21.58s,21.81s
kl-f8のFP16化を埋め込んで生成:21.65s,21.61s
kl-f8のFP16化を埋め込んでモデルをfp16化して生成:21.56s,21.68s
None:21.49s,21.54s
kl-f8-anime2.pt:21.35s,21.67s
kl-f8-anime2(fp16化):21.38s,21.70s
novelai:21.45s,21.80s
kl-f8のFP16化を埋め込んで生成:21.34s,21.68s
None:21.66s,21.89s
kl-f8-anime2.pt:21.29s,21.88s
kl-f8-anime2(fp16化):21.51s,21.62s
novelai:21.45s,21.80s
kl-f8のFP16化を埋め込んで生成:21.55s,21.67s
kl-f8のFP16化を埋め込んでモデルをfp16化して生成:21.45s,21.86s
no-half系の引数つけてない限り
モデルもVAEも内部ではfloat16(half)で処理してるから変わるはずがない。