摘要:
Ik中文分词的引入ik版本号:IKAnalyzer2012FF_hf1下载地址:http://code.google.com/p/ik-analyzer/downloads/list解压lIKAnalyzer2012FF_u1.jar、IKAnalyzer.cfg.xml、stopword.dic拷到E:\apache-tomcat-7.0.40\webapps\solr\WEB-INF\lib下l修改E:\apache-tomcat-7.0.40\webapps\solr\solr_home\collection1\conf下的schema.xml注意放的位置,这个要放到之前(注意事项:输入 阅读全文
posted @ 2013-11-28 10:59
蓦然回首的包子
阅读(762)
评论(0)
推荐(0)
摘要:
Windowssolr(tomcat)1.1.安装步骤1.1.1准备工作1.服务器:apache-tomcat-7.0.40压缩版,http://localhost:8080/安装是否成功;2.Solr版本:solr4.3http://mirror.bjtu.edu.cn/apache/lucene/solr/4.3.0/3.我的tomcat安装路径为E:\apache-tomcat-7.0.40,solr解压路径为E:\solr-4.3.04.建议采用notepad编辑器用记事本或者写字板一堆隐藏问题。。。1.1.2具体步骤1.部署Solr(推荐方法1)Ø将E:\solr-4.3. 阅读全文
posted @ 2013-11-28 10:58
蓦然回首的包子
阅读(369)
评论(0)
推荐(0)
摘要:
solr索引当我们真正进入到Lucene源代码之中的时候,我们会发现:• Lucene的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。• Lucene的搜索过程,就是按照此文件格式将索引进去的信息读出来,然后计算每篇文档打分(score)的过程。lucene的工作方式lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源。l写入流程源字符串首先经过analyzer处理,包括:分词,分成一个个单词;去除stopword(可选)。将源中需要的信 阅读全文
posted @ 2013-11-28 10:55
蓦然回首的包子
阅读(2975)
评论(0)
推荐(0)

浙公网安备 33010602011771号