摘要: Sphinx(狮身人面像) 想必大家都比较了解,就不作介绍了,不了解的童鞋可以自己Google。 原生的Sphinx只支持中文, 所以这里重点介绍支持中文分词的 Coreseek。 注意:Coreseek 3.2 后,只有安装 Coreseek 就可以了,它对LibMMSeg和sphinx做了整合,不用再安装原生Sphinx。(3.2前是要安装原生Sphinx,还要装补丁,非常繁琐) 安装coreseek 下面以coreseek-3.2.14为例,它基于Sphinx 0.99(不用安装Sphinx 0.99) 详细官方手册:http://www.coreseek.cn/product... 阅读全文
posted @ 2011-10-17 08:41 searchDM 阅读(535) 评论(0) 推荐(0) 编辑
摘要: Solr 是基于lucene的检索服务器。能够很快的搭建检索服务,并且提供的很多实用的组件。例如 高亮(highlight)、拼写检查(spellCheck)和匹配相位(moreLikeThis)。下面我将在我工作中接触到的一些实践与大家分 享。(我当前使用的solr 版本是 3.4,使用tomcat 7.0.21) (如果你也使用的是 tomcat 服务器,而且查询请求包含中文的话,还需要 修改 TOMCAT_HOME/conf/server.xml 的 <Connector ... URIEncoding="UTF-8"/> 使用 UTF-8 编码,详见 U 阅读全文
posted @ 2011-10-17 08:31 searchDM 阅读(1027) 评论(0) 推荐(0) 编辑