语音合成入门项目之一——ChatTTS离线部署

1. ChatTTS介绍
ChatTTS是一个专门为用户对话场景设计的语音生成模型,以其高实用性和质量而闻名。
2. 优缺点
优点:ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音,除此之外该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语
缺点:不支持克隆语音
3. 源码部署(ubuntu22.04)
源码仓库:https://github.com/2noise/ChatTTS/tree/main
预训练模型仓库:https://huggingface.co/2Noise/ChatTTS
根据readme.txt创建conda环境【离线部署时需移植环境】
创建asset文件夹(ChatTTS-main目录下),里面存放下载好的预训练模型【离线部署必须】
源码结构简介:ChatTTS pip包源码、示例推理脚本集合(examples\test)、工具包、pip包打包脚本setup.py。
体验Demo:python examples/web/webui.py
注意:执行上述命令后可能会报错,根据报错升级某些依赖包即可。
4. webDemo页面介绍

5. 音色选择
根据稳定性测试实验,以下种子比较出色:2155、1185、个人体验(2、4)也不错。
6. 云体验
https://huggingface.co/spaces/lenML/ChatTTS-Forge【需要魔法上网】

posted @ 2024-09-24 15:29  叶子的龙少  阅读(1123)  评论(0)    收藏  举报