F5-TTS 有哪些亮点?

  • 在 E2-TTS 的基础上改进:文本表示细化推理采样策略
  • 在保持简单架构的同时,提供了更好的性能和更快的推理速度。
  • 零样本能力更强,也就是语音克隆效果更加惊艳(文末有实测)

官方实测,不管在英文和中文数据集上,均优于阿里开源的 CosyVoice:

posted on 2025-03-16 16:54  leapss  阅读(9)  评论(0)    收藏  举报