windows下跑kaldi的thchs30训练脚本

主要的坑有两个

第一,要解决git bash环境下python脚本输出重定向问题,网上有的说可用winpty解决,但我没成功,我采用笨办法,在cmd环境下手动运行py脚本输出结果。

第二,要解决kaldi script使用ark:-标准输入输出问题,我采用的是临时文件方式解决。

最耗内存的是fstdeterminizestar操作,约需100GB。使用物理内存16G(DDR3) + 虚拟内存82G(SSD),10个小时左右跑完单个fstdeterminizestar操作。

各模型解码测试结果如下(暂未训练和测试神经网络模型):

mono

decode_test_word: %WER 67.94 [ 33346 / 49085, 2115 ins, 4683 del, 26548 sub ] at wer_10_1.0
decode_test_phone: %WER 44.91 [ 72878 / 162278, 2504 ins, 5851 del, 64523 sub ] at wer_7_0.5

tri1

decode_test_word: %WER 57.15 [ 28053 / 49085, 2923 ins, 3360 del, 21770 sub ] at wer_13_1.0
decode_test_phone: %WER 30.04 [ 48753 / 162278, 1994 ins, 2632 del, 44127 sub ] at wer_7_1.0

tri2b

decode_test_word: %WER 54.51 [ 26758 / 49085, 3571 ins, 2711 del, 20476 sub ] at wer_12_1.0
decode_test_phone: %WER 26.25 [ 42597 / 162278, 1496 ins, 2682 del, 38419 sub ] at wer_7_1.0

tri3b

decode_test_word: %WER 52.31 [ 25675 / 49085, 3546 ins, 2682 del, 19447 sub ] at wer_14_1.0
decode_test_phone: %WER 23.28 [ 37772 / 162278, 1502 ins, 2261 del, 34009 sub ] at wer_7_1.0

tri4b

decode_test_word: %WER 51.32 [ 25189 / 49085, 3819 ins, 2434 del, 18936 sub ] at wer_15_1.0
decode_test_phone: %WER 21.38 [ 34694 / 162278, 1512 ins, 1883 del, 31299 sub ] at wer_7_1.0

 

posted @ 2022-03-04 08:25  koala999  阅读(150)  评论(0)    收藏  举报