TTS

HiFi-GAN解读

2025年1月3日 yl

HiFi-GAN: Generative Adversarial Networks for
Efficient and High Fidelity Speech Synthesis

目前vcoder的三个主流方向：

Autoregressive。代表：wavenet。缺点：生成语音效率低
Flow-based。代表：Parallel Wavenet、 waveglow。缺点：参数量大。
GAN-based。代表：MelGAN、CLariNet、GAN-TTS。缺点：生成语音音质稍差。

HiFi-GAN的优势：合成速度快、泛化能力强、参数量小、合成音质高。

橙子说，快乐地说…