weiyun

2012年9月24日

Individual Project: Word Frequency

摘要:之前没写过博客,为了软工作业才开的博客。WordFrequency程序,代码不难。预计时间1小时,实际用时1.5小时(主要是编码探测部分费了时间)。主要使用了1.单词类Word2.单词库类(使用KeyedCollection)3.分词部分用的是Regex类3.文件搜索也用了Regex4.采用了CodeProject的一个编码探测的封装类,封装了MLang接口的相关编码探测函数。性能分析一直出错,家里的电脑业装不上2012,回学校再补充。后来性能分析成功了,下面是图片:可以看出探测代码和正则表达式匹配占了主要时间,因此最终还是决定取消编码探测部分,改为只检测bom,这样可以判断常用的unicod 阅读全文

posted @ 2012-09-24 00:22 weiyun 阅读 (136) 评论 (1) 编辑

My Links

Blog Stats