橙语

搜索
跳至内容
TTS

HiFi-GAN解读

2025年1月3日 yl

HiFi-GAN: Generative Adversarial Networks for
Efficient and High Fidelity Speech Synthesis

目前vcoder的三个主流方向:

  • Autoregressive。代表:wavenet。缺点:生成语音效率低
  • Flow-based。 代表:Parallel Wavenet、 waveglow。缺点:参数量大。
  • GAN-based。代表:MelGAN、CLariNet、GAN-TTS。缺点:生成语音音质稍差。

HiFi-GAN的优势:合成速度快、泛化能力强、参数量小、合成音质高。

文章导航

上一文章最长回文子串下一文章重启

橙子说,快乐地说…

近期文章

  • 坚持一个季度
  • 坚持一个月
  • 新年flag
  • 重启
  • HiFi-GAN解读

近期评论

    文章归档

    • 2025年四月
    • 2025年二月
    • 2025年一月
    • 2020年六月
    • 2020年四月
    • 2020年三月
    • 2020年二月
    • 2018年十二月
    • 2018年十一月
    • 2018年三月
    • 2018年二月
    • 2017年十月
    • 2017年二月
    • 2016年九月
    • 2016年八月
    • 2016年五月
    • 2016年一月
    • 2015年十二月

    分类目录

    • ASR
    • C++
    • DataStruct
    • IT&Linux
    • Math
    • TTS
    • 拾遗
    • 算法刷题
    • 随笔

    功能

    • 登录
    • 文章RSS
    • 评论RSS
    • WordPress.org
    京ICP备15063773 自豪地采用WordPress