从零开始学kaldi - 随笔分类(第2页) - WELEN

摘要：utils/split_data.sh 阅读全文

posted @ 2017-09-14 15:58 WELEN 阅读(2091) 评论(0) 推荐(0)

摘要：转：http://blog.csdn.net/shmilyforyq/article/details/76807431 博主话：这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译，因为不是专业翻译人士，接触kaldi时间也不长，阅读全文

posted @ 2017-09-13 17:06 WELEN 阅读(3310) 评论(0) 推荐(0)

[转]kaldi中的特征提取

摘要：转：http://blog.csdn.net/wbgxx333/article/details/25778483 本翻译原文http://kaldi.sourceforge.net/feat.html，由@煮八戒翻译，@wbglearn校对和修改。特征提取简介我们做特征提取和波形读取的这部分代阅读全文

posted @ 2017-09-13 17:02 WELEN 阅读(2797) 评论(0) 推荐(0)

[转]kaldi上的深度神经网络

摘要：转：http://blog.csdn.net/wbgxx333/article/details/41019453 深度神经网络已经是语音识别领域最热的话题了。从2010年开始，许多关于深度神经网络的文章在这个领域发表。许多大型科技公司（谷歌和微软）开始把DNN用到他们的产品系统里。（备注：谷歌的应该阅读全文

posted @ 2017-09-13 16:44 WELEN 阅读(1906) 评论(0) 推荐(0)

[转]kaldi中的在线识别----Online Recognizers

摘要：转自： http://blog.csdn.net/wbgxx333/article/details/24932533 本文是kaldi学习联盟中@冒顿翻译的，下面是@冒顿的翻译结果，在这里感谢@冒顿的辛勤劳动，希望更多的人加入到这个翻译上来，为更多的人学习…… 因为我们翻译的文档都有url，csdn 阅读全文

posted @ 2017-09-13 11:30 WELEN 阅读(1343) 评论(0) 推荐(0)

[转]决策树在Kaldi中如何使用

摘要：转自：http://blog.csdn.net/chenhoujiangsir/article/details/51613144 说明：本文是kaldi主页相关内容的翻译（http://kaldi-asr.org/doc/tree_externals.html）。目前网上已经有一个翻译的版本，但翻译阅读全文

posted @ 2017-09-12 17:48 WELEN 阅读(2408) 评论(0) 推荐(0)

[转]data-driven与决策树聚类的两种方法

摘要：参考文章： http://blog.csdn.net/quheDiegooo/article/details/60873999 http://blog.csdn.net/quhediegooo/article/details/61202901 在发音过程中，因为协同发音的影响，同一个音素在不同的位置阅读全文

posted @ 2017-09-12 16:34 WELEN 阅读(2659) 评论(0) 推荐(0)

从单音素到三音素模型

摘要：参考文章：《Tree-Based State Tying for High Accuracy Acoustic Modelling Basics Triphone Tying Decision Trees 》, S.J. Young, J.J. Odell, P.C. Woodland 1994. 阅读全文

posted @ 2017-09-12 14:35 WELEN 阅读(8410) 评论(2) 推荐(2)

[转] 语音识别基本原理介绍----gmm-hmm中的embedded training （嵌入式训练）

摘要：转自：http://blog.csdn.net/wbgxx333/article/details/38986507 本文是翻译Speech and Language Processing: An introduction to natural language processing, computa 阅读全文

posted @ 2017-09-11 16:36 WELEN 阅读(1243) 评论(0) 推荐(0)

Kaldi单音素模型训练部分

摘要：在Kaldi中，单音素GMM的训练用的是Viterbi training，而不是Baum-Welch training。因此就不是用HMM Baum-Welch那几个公式去更新参数，也就不用计算前向概率、后向概率了。Kaldi中用的是EM算法用于GMM时的那三个参数更新公式，并且稍有改变。 Baum 阅读全文

posted @ 2017-09-11 15:22 WELEN 阅读(8166) 评论(1) 推荐(0)

创建自己的语音识别系统

摘要：Data preparation Audio data 自己创建数据集： 10个不同的说话人每个人说10句话每句话包含3个词总共300个词，(数字0～9) Task kaldi-trunk/egs/digits创建digits_audio 文件夹，然后digits_audio,再创建train 阅读全文

posted @ 2017-09-08 17:40 WELEN 阅读(2556) 评论(0) 推荐(0)

kaldi实例脚本运行

摘要：Getting started, and prerequisites. rm/s5/run.sh Data preparation 如果有GridEngine, 如果需要在本地运行 local : Contains the dictionary for the current data. 包含当前数阅读全文

posted @ 2017-09-08 14:42 WELEN 阅读(2563) 评论(0) 推荐(0)

Kaldi如何准备自己的数据

摘要：Introduction 跑完kaldi的一些脚本例子，你可能想要自己用Kaldi跑自己的数据集。这里将会阐述如何准备好数据。 run.sh较上的部分是有关数据准备的，通常local与数据集相关。例如：RM数据集再例如：再WSJ数据集 Data preparation-- the "data" 阅读全文

posted @ 2017-09-07 18:17 WELEN 阅读(6321) 评论(0) 推荐(0)

语音识别概述

摘要：后验概率最大，即为判别结果 HTK Hvite解码器 Sphinx解码器 TODE解码器，生硬，修改繁琐。 WFST 扩充，简单高效。有限状态机模型被用于大词汇量连续中文语音识别系统中。其操作思路是将传统语音识别系统中的数学模型，分别转换成有限状态机模型，再将转换后的模型进行有效地整合及优化，得阅读全文

posted @ 2017-09-07 15:40 WELEN 阅读(2726) 评论(0) 推荐(0)

yesno孤立词识别kaldi脚本

摘要：path.sh主要设定路径等 ../../local/create_yesno_wav_scp.pl ${waves_dir} waves.test > ${test_base_name}_wav.scp ../../local/create_yesno_wav_scp.pl ${waves_dir 阅读全文

posted @ 2017-09-06 15:46 WELEN 阅读(6473) 评论(2) 推荐(0)

WELEN

随笔分类 - 从零开始学kaldi

公告