答辩前新增毕业设计日志

 

2010/5/4 开始尝试最后一次中文训练,录音转成了monoownR文件夹是新训练出来的model。明天尝试用用这个model行不行。

 

2010/5/8 Mandarin工程中成功运用了训练的中文模型,但是58的发音识别率太低了,应该再增加训练语音库试试。备份MandarinMandarin100508,然后开始看怎样把application转到applet。然后再增加训练语音库,下次记得产生jar包的时候,从干净的Sphinx包生成。要不然产生的jar包会包含所有的历史记录。

 

那个每次新获取数据时,导致程序crush的异常是由第二次执行到targetDataLine.open(audioFormat);抛出,我把capture里面的主体代码(包含以上代码),放到程序初始化的时候执行一遍,不会第二次执行以上程序,问题回避了。目前看上去程序没有什么问题。

忘了以前记录的sphinx对语音的要求是什么了,希望没有问题。

 

现在还需加入结果的反馈label

然后把好的appletgae连起来,然后弄成中文。

然后给applet数字签名调试。

 

2010/5/9 00:24

结果的反馈label搞定,localappletgae连了起来。Applet0508备份到Applet0508backup0509.rar

睡觉。起床后把中文加入(MandarinGAEWave0123的合并),然后给applet数字签名传到网站上,然后再采样更多的语音进行训练,增强系统的强壮性。

 

有个奇怪的问题,我看文档上说Sphinx4BigEndian的数据,为什么我Microphone设的是SmallEndian的数据也可以呢?

 

成功连接GAEWave0509Applet0508,接下来就是applet进行数字签名放到GAE包中。和增加训练语音。

 

GAEWave0509工程成功。备份

 

2010/5/12 申请了http://speechcloud.appspot.com/,准备最后deploy到这个域名上。

 

2010/5/15 重新弄了一遍语音,增加了我和静静的各三套1-10的语音,但竟然训练出来呢的模型不能识别8

 

speechcloud.appspot.com下载下来的applet总是在很短的时间就timeout, 但相同的applet代码,从eclipse中启动,连到sppechcloud就能等待直到结果返回,查询URLConnection类发现只要readTimeout时间为0就是无限制的等待直到服务器端返回结果。我的applet中是0。后来我尝试了了setReadTimeout30000毫秒,试试看会不会有变动。从理论上讲是没什么不一样的。如果还不行,尝试把setReadTimeout的命令往前提一点执行。现在网络有问题,我eclipse中的工程不能deployspeechcloud上。再试一下,不行就明天再试了。

 

一切OK。

posted @ 2010-05-23 20:26  Rossi  阅读(441)  评论(1编辑  收藏  举报