Kaldi的英文缩写

lang

language,语言

示例:data/lang

Language directory

bg

binary-grammar,二阶语言模型

示例:data/lang_test_bg_5k

Language directory used for test, with big dictionary of 5000 words

用于解码测试的语言目录,其字典为包含5000个单词的大字典

tg

triple-grammar,三阶语言模型

示例:data/lang_test_bd_tg

Language directory used for test, big dictionary, triple-grammar

用于解码测试的语言目录,大字典,三阶语言模型

fg

four-grammar,四阶语言模型

示例:data/lang_test_bd_fg

Language directory used for test, big dictionary, four-grammar

用于解码测试的语言目录,大字典,四阶语言模型

bd

big dict,大字典

示例:data/lang_test_bd_tgpr

Language directory used for test, big dictionary, pruned triple-grammar

用于解码测试的语言目录,大字典,裁剪过的三阶语言模型

pr

pruned,裁剪过的

示例:data/lang_test_tgpr_5k

Language directory used for test, with dictionary of 5000 words, pruned triple-grammar

用于解码测试的语言目录,其字典为包含5000个单词的大字典,裁剪过的三阶语言模型

DAE

Denoising Auto Encoder

降噪自动编码器,常作为DNN的前端,用于降噪

示例:thchs30/local/dae

hires

high resolution

高分辨率,高维数,通常表示40维的MFCC特征

示例:data/train_hires

sp

speed perturb,速度扰动,通常表示通过速度扰动进行增广过的数据集

silence phone,静音音素

nosp

no silence phone,无静音音素,通常用于音素集中没有静音音素的语言目录

示例:data/lang_nosp

nodup

no duplex,无重复的,文本无重复,通常表示已经将训练集相同标注的语句去除

示例:data/train_nodup

2y7d

数字+字母形式的调优版本,字母可省略。通常出现在kaldi/egs/*/local/{nnet3,chain}/tuning目录以及相关目录中。

a, b,..., z

1a, 1b,..., 1z

...

   

示例:

  1. swbd/s5c/local/chain/tuning/run_tdnn_blstm_a.sh

    TDNN-BLSTM的基线模型

  2. swbd/s5c/local/chain/tuning/run_tdnn_blstm_2y.sh

    TDNN-BLSTM的调优模型,版本为2y

  3. swbd/s5c/local/chain/tuning/run_tdnn_blstm_7d.sh

    TDNN-BLSTM的调优模型,版本为7d

  4. exp/chain/tri6_7d_tree

    版本为7d的调优模型所使用的决策树目录

  5. data/lang_chain_2y

    版本为2yChain调优模型所使用的语言目录

sw1

Switchboard 1

因为Switchboard由多个部分组成,而kaldi/egs/swbd示例只使用了Switchboard-1 Phase 1,因此相关数据集、转录等缩写为sw1

示例:

  1. data/lang_nosp_sw1_tg

    语言目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练

  2. exp/tri1/graph_nosp_sw1_tg

    解码图目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练

fsh

fisheregs/fisher_english示例及其相关数据

示例:data/lang_fsh_sw1_tg

语言目录,其中三阶语言模型使用fisher_englishSwitchboard 1的转录进行训练得到

xent

Cross Entropy,交叉熵,通常表示Chain模型的交叉熵正则化

示例:xent_regularize=0.1,交叉熵正则化系数

egs

examples,示例,通常表示Kaldi脚本示例

例如:kaldi/egs目录

   

examples,样本,通常表示训练样本

例如:exp/chain/tdnn_blstm_a/egs目录

   

eg

example,样本,通常表示训练样本

示例:

  1. --frames-overlap-per-eg 0

    训练样本之间重叠(重复)的帧数为0

  2. --frames-per-eg 50

    一个训练样本包含50

si

speeker independent,说话人无关,即没有进行说话人自适应训练(SAT

示例:steps/align_si.sh

说话人无关的对齐

posted @ 2019-07-09 12:00  JarvanWang  阅读(1013)  评论(0编辑  收藏  举报