语音朗读技术方案选型

  1. 昨天完成情况
    昨天花了 2 个小时,研究了 3 种语音朗读方案,分别是阿里云语音合成、百度 TTS,还有一个本地库 TTS-engine。对比下来,我觉得阿里云的方案比较靠谱,主要是它支持 SSML 标签。现在距离调研阶段结束还有 2 天,总共计划是 3 天完成调研。
  2. 遇到的困难
    本地库有个大问题,就是在不同系统上不好用,还得好好想想成本和稳定性的事儿。
  3. 今日任务
    今天打算写个 100 行左右的 Demo 代码,调用阿里云的 API,试试生成 1 分钟语音要等多久,效果咋样。另外,李世鹏 已经提交了状态机代码,里面的异常处理逻辑,我可以参考参考。
posted @ 2025-04-21 21:43  一如初见233  阅读(21)  评论(0)    收藏  举报