随笔分类 -  solr

关于solr的学习
摘要:Linux下的Nutch和solr集成3.1.Nutch安装l解压tar-zxvfapache-nutch-1.4-bin.tar.gzl终端下cd到目录apache-nutch-1.4-bin/runtime/local,下面会有binconfliblogspluginstest几个文件夹l输入命令bin/nutch,如果出现下面的提示,说明nutch可用。可能会出现权限不够的提示,chmod755bin/nutch,付给nutch执行权限。l继续测试,输入bin/nutchcrawl,如果提示Error:JAVA_HOMEisnotset.说明计算机或者没有安装jdk或者没有设定环境变量。 阅读全文
posted @ 2013-11-28 11:14 蓦然回首的包子 阅读(1347) 评论(0) 推荐(0)
摘要:集群安装(暂时做了1,2)配置基于zookeeper的分布式的solr服务。1) 一台zookeeper服务器,一台solr服务器。2) 一台zookeeper服务器,多台solr服务器。3) 多台zookeeper服务器,多台solr服务器。1)一台zookeeper服务器,一台solr服务器由于是只有一台solr服务器,也就是说只有一个leader节点,不存在follower节点。这种模式比较简单。操作步骤如下:l修改E:\apache-tomcat-7.0.40\webapps\solr\solr_home目录下的solr.xml文件,将将cores节点中的hostPort修改为tomc 阅读全文
posted @ 2013-11-28 11:03 蓦然回首的包子 阅读(339) 评论(0) 推荐(0)
摘要:Ik中文分词的引入ik版本号:IKAnalyzer2012FF_hf1下载地址:http://code.google.com/p/ik-analyzer/downloads/list解压lIKAnalyzer2012FF_u1.jar、IKAnalyzer.cfg.xml、stopword.dic拷到E:\apache-tomcat-7.0.40\webapps\solr\WEB-INF\lib下l修改E:\apache-tomcat-7.0.40\webapps\solr\solr_home\collection1\conf下的schema.xml注意放的位置,这个要放到之前(注意事项:输入 阅读全文
posted @ 2013-11-28 10:59 蓦然回首的包子 阅读(762) 评论(0) 推荐(0)
摘要:Windowssolr(tomcat)1.1.安装步骤1.1.1准备工作1.服务器:apache-tomcat-7.0.40压缩版,http://localhost:8080/安装是否成功;2.Solr版本:solr4.3http://mirror.bjtu.edu.cn/apache/lucene/solr/4.3.0/3.我的tomcat安装路径为E:\apache-tomcat-7.0.40,solr解压路径为E:\solr-4.3.04.建议采用notepad编辑器用记事本或者写字板一堆隐藏问题。。。1.1.2具体步骤1.部署Solr(推荐方法1)Ø将E:\solr-4.3. 阅读全文
posted @ 2013-11-28 10:58 蓦然回首的包子 阅读(369) 评论(0) 推荐(0)
摘要:solr索引当我们真正进入到Lucene源代码之中的时候,我们会发现:• Lucene的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。• Lucene的搜索过程,就是按照此文件格式将索引进去的信息读出来,然后计算每篇文档打分(score)的过程。lucene的工作方式lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源。l写入流程源字符串首先经过analyzer处理,包括:分词,分成一个个单词;去除stopword(可选)。将源中需要的信 阅读全文
posted @ 2013-11-28 10:55 蓦然回首的包子 阅读(2975) 评论(0) 推荐(0)