摘要: 以语音识别为例,如果现在有一个包含剪辑语音以及相应文本的数据集,如何将语音片段与文本字符一一对应,是训练语音识别器面临的首要问题。为了解决上述问题,我们制定简单的规则,如每个字符对应十个输入。考虑到不同的人说话的语速有区别,这样的规则并不具备泛化能力。当然,我们也可以手动的对齐每个字符在音频中的位置 阅读全文
posted @ 2022-07-14 11:42 熊猫帅帅 阅读(2263) 评论(0) 推荐(0)