随笔列表第2页 - WELEN

2017年9月18日

摘要：转：http://ftli.farbox.com/post/kaldizhong-wen-shi-bie 阅读全文

posted @ 2017-09-18 17:50 WELEN 阅读(4227) 评论(0) 推荐(0) 编辑

摘要：首先，thchs30有两种数据库，kaldi运行的数据库最好是 thchs30-openslr。修改run.sh里面的语音库路径 thchs30=... 修改nj线程数等于CPU的核心数修改cmd.sh queue.pl 改为run.pl本地机器跑运行出现错误: lexicon.txt验证出阅读全文

posted @ 2017-09-18 15:10 WELEN 阅读(6902) 评论(0) 推荐(0) 编辑

2017年9月15日

kaldi的TIMIT实例三

摘要： ============================================================================ MMI + SGMM2 Training & Decoding ===============================================... 阅读全文

posted @ 2017-09-15 17:59 WELEN 阅读(1867) 评论(0) 推荐(0) 编辑

kaldi的TIMIT实例二

摘要： steps/diagnostic/analyze_alignments.sh --cmd run.pl --mem 4G data/lang exp/monosteps/diagnostic/analyze_alignments.sh: see stats in exp/mono/log/analy 阅读全文

posted @ 2017-09-15 12:09 WELEN 阅读(1426) 评论(0) 推荐(0) 编辑

kaldi的TIMIT实例一

摘要： TIMIT语音库是IT和MIT合作音素级别标注的语音库，用于自动语音识别系统的发展和评估，包括来自美式英语，8个地区方言，630个人。每个人读10个句子，每个发音都是音素级别、词级别文本标注，16kHz,16bit。注意：不用使用TIMIT配置作为运行Kaldi的一个通用型例子，因为它不是一个非阅读全文

posted @ 2017-09-15 11:40 WELEN 阅读(4935) 评论(0) 推荐(0) 编辑

2017年9月14日

kaldi脚本注释二

摘要： steps/decode.sh 阅读全文

posted @ 2017-09-14 17:31 WELEN 阅读(2370) 评论(0) 推荐(0) 编辑

kaldi脚本注释一

摘要： utils/split_data.sh 阅读全文

posted @ 2017-09-14 15:58 WELEN 阅读(2047) 评论(0) 推荐(0) 编辑

2017年9月13日

[转]kaldi特征和模型空间转换

摘要：转：http://blog.csdn.net/shmilyforyq/article/details/76807431 博主话：这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译，因为不是专业翻译人士，接触kaldi时间也不长，阅读全文

posted @ 2017-09-13 17:06 WELEN 阅读(3231) 评论(0) 推荐(0) 编辑

[转]kaldi中的特征提取

摘要：转：http://blog.csdn.net/wbgxx333/article/details/25778483 本翻译原文http://kaldi.sourceforge.net/feat.html，由@煮八戒翻译，@wbglearn校对和修改。特征提取简介我们做特征提取和波形读取的这部分代阅读全文

posted @ 2017-09-13 17:02 WELEN 阅读(2734) 评论(0) 推荐(0) 编辑

[转]kaldi上的深度神经网络

摘要：转：http://blog.csdn.net/wbgxx333/article/details/41019453 深度神经网络已经是语音识别领域最热的话题了。从2010年开始，许多关于深度神经网络的文章在这个领域发表。许多大型科技公司（谷歌和微软）开始把DNN用到他们的产品系统里。（备注：谷歌的应该阅读全文

posted @ 2017-09-13 16:44 WELEN 阅读(1885) 评论(0) 推荐(0) 编辑

[转]语音识别中区分性训练（Discriminative Training）和最大似然估计（ML）的区别

摘要：转：http://blog.sina.com.cn/s/blog_66f725ba0101bw8i.html 关于语音识别的声学模型训练方法已经是比较成熟的方法，一般企业或者研究机构会采用HTK工具包、Kaldi等进行训练，目前从声学模型出发，提高系统性能的主要策略主要有： 1）增加训练数据。不同的阅读全文

posted @ 2017-09-13 16:23 WELEN 阅读(2605) 评论(0) 推荐(0) 编辑

[转]kaldi中的在线识别----Online Recognizers

摘要：转自： http://blog.csdn.net/wbgxx333/article/details/24932533 本文是kaldi学习联盟中@冒顿翻译的，下面是@冒顿的翻译结果，在这里感谢@冒顿的辛勤劳动，希望更多的人加入到这个翻译上来，为更多的人学习…… 因为我们翻译的文档都有url，csdn 阅读全文

posted @ 2017-09-13 11:30 WELEN 阅读(1335) 评论(0) 推荐(0) 编辑

2017年9月12日

[转]决策树在Kaldi中如何使用

摘要：转自：http://blog.csdn.net/chenhoujiangsir/article/details/51613144 说明：本文是kaldi主页相关内容的翻译（http://kaldi-asr.org/doc/tree_externals.html）。目前网上已经有一个翻译的版本，但翻译阅读全文

posted @ 2017-09-12 17:48 WELEN 阅读(2395) 评论(0) 推荐(0) 编辑

[转]data-driven与决策树聚类的两种方法

摘要：参考文章： http://blog.csdn.net/quheDiegooo/article/details/60873999 http://blog.csdn.net/quhediegooo/article/details/61202901 在发音过程中，因为协同发音的影响，同一个音素在不同的位置阅读全文

posted @ 2017-09-12 16:34 WELEN 阅读(2592) 评论(0) 推荐(0) 编辑

从单音素到三音素模型

摘要：参考文章：《Tree-Based State Tying for High Accuracy Acoustic Modelling Basics Triphone Tying Decision Trees 》, S.J. Young, J.J. Odell, P.C. Woodland 1994. 阅读全文

posted @ 2017-09-12 14:35 WELEN 阅读(8318) 评论(2) 推荐(2) 编辑

2017年9月11日

[转] 语音识别基本原理介绍----gmm-hmm中的embedded training （嵌入式训练）

摘要：转自：http://blog.csdn.net/wbgxx333/article/details/38986507 本文是翻译Speech and Language Processing: An introduction to natural language processing, computa 阅读全文

posted @ 2017-09-11 16:36 WELEN 阅读(1234) 评论(0) 推荐(0) 编辑

Kaldi单音素模型训练部分

摘要：在Kaldi中，单音素GMM的训练用的是Viterbi training，而不是Baum-Welch training。因此就不是用HMM Baum-Welch那几个公式去更新参数，也就不用计算前向概率、后向概率了。Kaldi中用的是EM算法用于GMM时的那三个参数更新公式，并且稍有改变。 Baum 阅读全文

posted @ 2017-09-11 15:22 WELEN 阅读(8056) 评论(1) 推荐(0) 编辑

2017年9月8日

创建自己的语音识别系统

摘要： Data preparation Audio data 自己创建数据集： 10个不同的说话人每个人说10句话每句话包含3个词总共300个词，(数字0～9) Task kaldi-trunk/egs/digits创建digits_audio 文件夹，然后digits_audio,再创建train 阅读全文

posted @ 2017-09-08 17:40 WELEN 阅读(2511) 评论(0) 推荐(0) 编辑

kaldi实例脚本运行

摘要： Getting started, and prerequisites. rm/s5/run.sh Data preparation 如果有GridEngine, 如果需要在本地运行 local : Contains the dictionary for the current data. 包含当前数阅读全文

posted @ 2017-09-08 14:42 WELEN 阅读(2547) 评论(0) 推荐(0) 编辑

2017年9月7日

Kaldi如何准备自己的数据

摘要： Introduction 跑完kaldi的一些脚本例子，你可能想要自己用Kaldi跑自己的数据集。这里将会阐述如何准备好数据。 run.sh较上的部分是有关数据准备的，通常local与数据集相关。例如：RM数据集再例如：再WSJ数据集 Data preparation-- the "data" 阅读全文

posted @ 2017-09-07 18:17 WELEN 阅读(6229) 评论(0) 推荐(0) 编辑

WELEN

公告