HiFi-GAN: Generative Adversarial Networks for
Efficient and High Fidelity Speech Synthesis
目前vcoder的三个主流方向:
- Autoregressive。代表:wavenet。缺点:生成语音效率低
- Flow-based。 代表:Parallel Wavenet、 waveglow。缺点:参数量大。
- GAN-based。代表:MelGAN、CLariNet、GAN-TTS。缺点:生成语音音质稍差。
HiFi-GAN的优势:合成速度快、泛化能力强、参数量小、合成音质高。