摘要:
作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。 阅读全文
posted @ 2008-08-31 05:33
Birdshover
阅读(7287)
评论(12)
推荐(2)
摘要:
本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。 阅读全文
posted @ 2008-08-31 00:51
Birdshover
阅读(9877)
评论(34)
推荐(2)

浙公网安备 33010602011771号