paip.lucene 4.3 中文语义搜索最佳实践
摘要:
paip.lucene 4.3 中文语义搜索最佳实践 首先一个问题是要不要使用lucene 自带的分词器...我觉得最好不使用哪自带的分词器.效果还凑火,就是不好控制... 先使用ik,ict,mmsj等分词器进行分词.. 然后使用WhitespaceAnalyzer 建立索引...再使用它进行搜索...注意,建立索引以及搜索使用的Analyzer要一样才行.. 要是使用StandardAnalyzer,不个单字也分割开兰,后期过滤麻烦... 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:... 阅读全文
posted @ 2013-11-14 20:29 新一 阅读(255) 评论(0) 推荐(0)