心胸决定格局,眼界决定境界...

随笔分类 -  从零开始学kaldi

摘要:utils/split_data.sh 阅读全文
posted @ 2017-09-14 15:58 WELEN 阅读(2041) 评论(0) 推荐(0) 编辑
摘要:转:http://blog.csdn.net/shmilyforyq/article/details/76807431 博主话:这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译,因为不是专业翻译人士,接触kaldi时间也不长, 阅读全文
posted @ 2017-09-13 17:06 WELEN 阅读(3219) 评论(0) 推荐(0) 编辑
摘要:转:http://blog.csdn.net/wbgxx333/article/details/25778483 本翻译原文http://kaldi.sourceforge.net/feat.html,由@煮八戒翻译,@wbglearn校对和修改。 特征提取 简介 我们做特征提取和波形读取的这部分代 阅读全文
posted @ 2017-09-13 17:02 WELEN 阅读(2727) 评论(0) 推荐(0) 编辑
摘要:转:http://blog.csdn.net/wbgxx333/article/details/41019453 深度神经网络已经是语音识别领域最热的话题了。从2010年开始,许多关于深度神经网络的文章在这个领域发表。许多大型科技公司(谷歌和微软)开始把DNN用到他们的产品系统里。(备注:谷歌的应该 阅读全文
posted @ 2017-09-13 16:44 WELEN 阅读(1884) 评论(0) 推荐(0) 编辑
摘要:转自: http://blog.csdn.net/wbgxx333/article/details/24932533 本文是kaldi学习联盟中@冒顿翻译的,下面是@冒顿的翻译结果,在这里感谢@冒顿的辛勤劳动,希望更多的人加入到这个翻译上来,为更多的人学习…… 因为我们翻译的文档都有url,csdn 阅读全文
posted @ 2017-09-13 11:30 WELEN 阅读(1332) 评论(0) 推荐(0) 编辑
摘要:转自:http://blog.csdn.net/chenhoujiangsir/article/details/51613144 说明:本文是kaldi主页相关内容的翻译(http://kaldi-asr.org/doc/tree_externals.html)。目前网上已经有一个翻译的版本,但翻译 阅读全文
posted @ 2017-09-12 17:48 WELEN 阅读(2382) 评论(0) 推荐(0) 编辑
摘要:参考文章: http://blog.csdn.net/quheDiegooo/article/details/60873999 http://blog.csdn.net/quhediegooo/article/details/61202901 在发音过程中,因为协同发音的影响,同一个音素在不同的位置 阅读全文
posted @ 2017-09-12 16:34 WELEN 阅读(2567) 评论(0) 推荐(0) 编辑
摘要:参考文章: 《Tree-Based State Tying for High Accuracy Acoustic Modelling Basics Triphone Tying Decision Trees 》, S.J. Young, J.J. Odell, P.C. Woodland 1994. 阅读全文
posted @ 2017-09-12 14:35 WELEN 阅读(8298) 评论(2) 推荐(2) 编辑
摘要:转自:http://blog.csdn.net/wbgxx333/article/details/38986507 本文是翻译Speech and Language Processing: An introduction to natural language processing, computa 阅读全文
posted @ 2017-09-11 16:36 WELEN 阅读(1234) 评论(0) 推荐(0) 编辑
摘要:在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum-Welch training。因此就不是用HMM Baum-Welch那几个公式去更新参数,也就不用计算前向概率、后向概率了。Kaldi中用的是EM算法用于GMM时的那三个参数更新公式,并且稍有改变。 Baum 阅读全文
posted @ 2017-09-11 15:22 WELEN 阅读(8043) 评论(1) 推荐(0) 编辑
摘要:Data preparation Audio data 自己创建数据集: 10个不同的说话人 每个人说10句话 每句话包含3个词 总共300个词,(数字0~9) Task kaldi-trunk/egs/digits创建digits_audio 文件夹,然后digits_audio,再创建train 阅读全文
posted @ 2017-09-08 17:40 WELEN 阅读(2505) 评论(0) 推荐(0) 编辑
摘要:Getting started, and prerequisites. rm/s5/run.sh Data preparation 如果有GridEngine, 如果需要在本地运行 local : Contains the dictionary for the current data. 包含当前数 阅读全文
posted @ 2017-09-08 14:42 WELEN 阅读(2546) 评论(0) 推荐(0) 编辑
摘要:Introduction 跑完kaldi的一些脚本例子,你可能想要自己用Kaldi跑自己的数据集。这里将会阐述如何准备好数据。 run.sh较上的部分是有关数据准备的,通常local与数据集相关。 例如:RM数据集 再例如:再WSJ数据集 Data preparation-- the "data" 阅读全文
posted @ 2017-09-07 18:17 WELEN 阅读(6197) 评论(0) 推荐(0) 编辑
摘要:后验概率最大,即为判别结果 HTK Hvite解码器 Sphinx解码器 TODE解码器,生硬,修改繁琐。 WFST 扩充,简单高效。 有限状态机模型被用于大词汇量连续中文语音识别系统中。 其操作思路是将传统语音识别系统中的数学模型,分别转换成有限状态机模型,再将转换后的模型进行有效地整合及优化,得 阅读全文
posted @ 2017-09-07 15:40 WELEN 阅读(2705) 评论(0) 推荐(0) 编辑
摘要:path.sh主要设定路径等 ../../local/create_yesno_wav_scp.pl ${waves_dir} waves.test > ${test_base_name}_wav.scp ../../local/create_yesno_wav_scp.pl ${waves_dir 阅读全文
posted @ 2017-09-06 15:46 WELEN 阅读(6328) 评论(2) 推荐(0) 编辑