windows下跑kaldi的thchs30训练脚本
主要的坑有两个
第一,要解决git bash环境下python脚本输出重定向问题,网上有的说可用winpty解决,但我没成功,我采用笨办法,在cmd环境下手动运行py脚本输出结果。
第二,要解决kaldi script使用ark:-标准输入输出问题,我采用的是临时文件方式解决。
最耗内存的是fstdeterminizestar操作,约需100GB。使用物理内存16G(DDR3) + 虚拟内存82G(SSD),10个小时左右跑完单个fstdeterminizestar操作。
各模型解码测试结果如下(暂未训练和测试神经网络模型):
mono
decode_test_word: %WER 67.94 [ 33346 / 49085, 2115 ins, 4683 del, 26548 sub ] at wer_10_1.0
decode_test_phone: %WER 44.91 [ 72878 / 162278, 2504 ins, 5851 del, 64523 sub ] at wer_7_0.5
tri1
decode_test_word: %WER 57.15 [ 28053 / 49085, 2923 ins, 3360 del, 21770 sub ] at wer_13_1.0
decode_test_phone: %WER 30.04 [ 48753 / 162278, 1994 ins, 2632 del, 44127 sub ] at wer_7_1.0
tri2b
decode_test_word: %WER 54.51 [ 26758 / 49085, 3571 ins, 2711 del, 20476 sub ] at wer_12_1.0
decode_test_phone: %WER 26.25 [ 42597 / 162278, 1496 ins, 2682 del, 38419 sub ] at wer_7_1.0
tri3b
decode_test_word: %WER 52.31 [ 25675 / 49085, 3546 ins, 2682 del, 19447 sub ] at wer_14_1.0
decode_test_phone: %WER 23.28 [ 37772 / 162278, 1502 ins, 2261 del, 34009 sub ] at wer_7_1.0
tri4b
decode_test_word: %WER 51.32 [ 25189 / 49085, 3819 ins, 2434 del, 18936 sub ] at wer_15_1.0
decode_test_phone: %WER 21.38 [ 34694 / 162278, 1512 ins, 1883 del, 31299 sub ] at wer_7_1.0
本文来自博客园,作者:koala999,转载请注明原文链接:https://www.cnblogs.com/koala999/articles/15744301.html

浙公网安备 33010602011771号