首页  :: 新随笔  :: 管理

阿里巴巴语音识别模型 DFSMN 的使用指南

Posted on 2018-11-15 08:44  季枫  阅读(1705)  评论(0编辑  收藏  举报


阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

    1. 语音识别流程简介;
    2. Kaldi 的部署使用;
    3. 如何训练基于中文的 DFSMN 声学模型;
    4. 语音特征提取 MFCC 算法源码解读;
    5. 语音识别工具对比。


https://gitbook.cn/gitchat/activity/5bcc8f9b0920511ab0ff412b

智读 | 成都会领科技有限公司官网 | 智读App下载 | 每天听本书的博客 | |