eaglet
本博专注于基于微软技术的搜索相关技术
posts - 182, comments - 3152, trackbacks - 26, articles - 0
博客园
::
首页
::
新随笔
::
联系
::
订阅
::
管理
日历
公告
2012年2月15日
HubbleDotNet 索引分词的测试方法和分词技巧
摘要: 在中文搜索中,分词技术是一个比较关键的技术,我们往往会遇到查询某个关键字无法匹配到相应文档的问题,这种问题往往都是索引的分词不理想造成的,倒排索引的技术特点决定了如果查询的关键字不在索引的分词中,则无法查出相应的文档。为了帮助使用者分析分词问题,hubbledotnet 专门提供几个存储过程来帮助检查索引分词的情况。
阅读全文
posted @ 2012-02-15 09:27 eaglet 阅读(1756) 评论(12)
编辑
Powered by:
博客园
Copyright © eaglet