weiyun

2012年10月19日

补发:Word Frequency总结

摘要:Word Frequency作业主要分为几个步骤1.读取所有文件的内容2.正确分词3.排序并输出为了节省时间,所以我用的都是.net自带的功能,看了一些同学的方法发现各部分的数据结构和实现方法数据结构:Hash:用Dictionary,插入删除查找速度快,需要最后手动排序。平衡树:SortedDictionary,自动排序,但插入删除查找操作比较费时。其他:KeyedCollection,类似Dictionary。读取文件内容:方法1:.net的Directory的GetFiles,参数使用所有子目录,一步获取所有文件,然后再判断扩展名,判断扩展名可用字符串函数或正则表达式优点:方法简单,实现 阅读全文

posted @ 2012-10-19 16:52 weiyun 阅读 (56) 评论 (0) 编辑

My Links

Blog Stats