2023 年 7月 29 日随笔档案 - 啊诚

2023年7月29日

语音合成技术2：FREEVC: TOWARDS HIGH-QUALITY TEXT-FREE ONE-SHOT VOICE CONVERSION

摘要：摘要语音转换（VC）可以通过首先提取源内容信息和目标说话者信息，然后利用这些信息重构波形来实现。然而，目前的方法通常要么提取带有泄漏说话者信息的不完整内容信息，要么需要大量带标注的数据进行训练。此外，由于转换模型与声码器之间的不匹配，重构波形的质量可能会下降。在本文中，我们采用了VITS的端到端框阅读全文

posted @ 2023-07-29 17:11 啊诚阅读(1125) 评论(0) 推荐(0)

语音合成技术汇总1：Glow-TTS：通过单调对齐实现文本到语音的生成流

摘要：今天开始开一期语音合成经典论文的翻译 Glow-TTS：通过单调对齐实现文本到语音的生成流摘要：最近，文本到语音（Text-to-Speech，TTS）模型，如FastSpeech和ParaNet，被提出以并行方式从文本生成mel频谱图（mel-spectrograms）。尽管并行TTS模型具有阅读全文

posted @ 2023-07-29 14:56 啊诚阅读(3417) 评论(0) 推荐(1)

啊诚

公告