2011 年 11月 14 日随笔档案 - 爱开卷360

2011年11月14日

摘要：开场白:作为一个人才网站的搜索功能,不但需要考滤搜索性能与效率，与需要注意用户体验,主要体现于用户对搜索结果的满意程度.大家都知道Lucene的排序中,如果单纯使用Lucene的DefaultSimilarity作为一个相似度的排序,意思是说总体上越相关的记录需要排得越前,但事与愿违.这样使用户体现也表现得相当糟糕.关键字"程序员"标题中也不能保证全部都匹配到(搜索结果来自 www.jobui.com 职友集) [下图]起因：之很长一段时间我都注重于搜索性能与速度的提高,而对于搜索结果对用户的体验却一直没有太多的关注,现在需要关注一下用户体现这个东西了.同时技术上也作为一些阅读全文

posted @ 2011-11-14 11:35 爱开卷360 阅读(8040) 评论(2) 推荐(0) 编辑

SOLR同义词中文问题

摘要：现象：在synonyms.txt输入中文同义词后，Tomcat启动报错，不能读取文件。原因：使用SOLR加入中文同义词需要把synonyms.txt的默认编码改成与自己系统使用的编码一致。比如说：你整个系统的编码都是用UTF-8,那么你就要把synonyms.txt这个文件的编码格式转换成UTF-8。原因是，对某个词进行同义的时候找到的词是乱码，而乱码在对于的索引中是没有存在的。这也就导致了中文不可以使用的原因。解决：在eclipse里把synonyms.txt文件编码格式转成UTF-8（系统默认UTF-8），然后再输入中文同义词，保存，重启tomcat，问题解决。总结：SOLR中文分词无法阅读全文

posted @ 2011-11-14 11:03 爱开卷360 阅读(2946) 评论(0) 推荐(0) 编辑

爱开卷360

好文章 • 爱开卷 • 360Tech

公告