摘要: 作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。 阅读全文
posted @ 2008-08-31 05:33 Birdshover 阅读(7287) 评论(12) 推荐(2)
摘要: 本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。 阅读全文
posted @ 2008-08-31 00:51 Birdshover 阅读(9877) 评论(34) 推荐(2)