10 2012 档案
摘要:使用SRILM这个工具编写语言模型工具的问题就是内存不怎么够。。。,内存最多就3G,还在跑另外的一个程序,所以想要一次训练完是不可能的,在http://www-speech.sri.com/projects/srilm/manpages/srilm-faq.7.html给出了一个解决的办法,那就是将大文件拆分成多个小文件,然后再将多个小文件的count合并,完成最终的训练。具体的做法如下: 首先使用split将一个大文件分成最多26*26(使用字母后缀,这是默认的行为)或者是100(使用数字后缀,需要-d参数)个文件,可以将文件按行拆分(使用-l num参数)或者是按大小拆分(使用-bsiz.
阅读全文
摘要:闲来无事,就想在mac平台下编译Moses,以后没事的时候可以折腾一下。但是编译的过程中发生了很多想不到的问题。Moses依赖于其他几个工具,比如GIZA++,SRILM和XMLRPC等工具包,相比于第一次编译,突然发觉现在的编译过程已经极大的简化了,但是有些网站却没有做相应的更新(http://www.statmt.org/moses_steps.html),但是可以很明显的看出问题,也就不详细解释了。 在编译SRILM这个工具包遇到了一个我觉得很蛋疼的问题,编译错误的提示信息如下:make[2]: [http://www.cnblogs.com/bin/macosx-m64/f...
阅读全文

浙公网安备 33010602011771号