语音克隆(SV2TTS)
语音克隆:
基于SV迁移学习的TTS模型
1:个性化的语音特征提取器(只需要五秒钟左右)
2:语音合成器,将文本转换为语音特征
3:声码器:将语音特征转换成音频输出(将前两个得到的矢量拼接起来)
github地址:github.com/CorentinJ/Real-Time-Voice-Cloning (英文)
github.com/babysor/MockingBird (中文)
中文只要将语音合成器修改一下就行了
效果并不好
语音克隆:
基于SV迁移学习的TTS模型
1:个性化的语音特征提取器(只需要五秒钟左右)
2:语音合成器,将文本转换为语音特征
3:声码器:将语音特征转换成音频输出(将前两个得到的矢量拼接起来)
github地址:github.com/CorentinJ/Real-Time-Voice-Cloning (英文)
github.com/babysor/MockingBird (中文)
中文只要将语音合成器修改一下就行了
效果并不好