摘要: 在网络上找了很多的关于solr的资料,发现非常的不全面,即使就是官方的wiki,也是如此! 基于现阶段正在研究的solr应用,陆续的会分享我的一些经验! 今天要说的是: 怎么跑起来! 1》 首先下载好solr,我用的是 solr1.3,下载地址: windows版本http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.zip linux版本http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.tgz ... 阅读全文
posted @ 2009-09-16 11:37 searchDM 阅读(668) 评论(0) 推荐(0) 编辑
摘要: 用ajax去请求solr服务。返回json,然后解释。让solr返回json的参数是wt=json。然后javascript用evel()解释成对象。 我的solr会返回:auother,title,introduce这几个域。先创建一个jsp或html,如:json.jsp 1.json.jsp关键的html内容 <formaction="select/"name="f1"method="get"onsubmit="xmlhttpPost('/solr/select');returnfalse;&qu 阅读全文
posted @ 2009-09-16 11:33 searchDM 阅读(754) 评论(0) 推荐(0) 编辑
摘要: solr的服务器端配置晚上有很多文章。 solr的客户端可以采用JAVA,PYTHON,C#,PHP,RUBY,JSON等语言。 使用java的客户端组件即为solrJ. 在Tomcat下部署一个应用。使用solrj,需要使用到这些jar文件: apache-solr-solrj-1.3.0.jar apache-solr-common-1.3.0.jar commons-httpclient-3.1.jar commons-codec-1.3.jar 这些文件在solr项目中都有提供。 阅读全文
posted @ 2009-09-16 11:20 searchDM 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 之前使用的是solr+paoding,后来发现庖丁的分词表面上比较容易扩展,但是实际上并不需要那么细分地去为每个细分领域建立一个词典。再发现庖丁的分词过于琐屑,在实际的生产环境中没有mmseg4j效果好。 solr的配置就不多说了。 参考:http://wiki.apache.org/solr/SolrTomcat 关于mmseg4j的配置还得好好说说。 网上有篇很好的文章: http://blog.chenlb.com/2009/04/solr-chinese-segment-mmseg4j-use-demo.html 说得比较详细了,不过我想对它的词典补充下: 第一,mmseg4... 阅读全文
posted @ 2009-09-16 11:19 searchDM 阅读(455) 评论(0) 推荐(0) 编辑
摘要: mmseg4j 第一个版本就可以方便地与 solr 集成,在 google code 上面有简单的说明,第一版的发布博客也有简单的使用说明:中文分词 mmseg4j。为了更清楚说明在 solr 中使用 mmseg4j 中文分词,还是写篇博客吧。 目前有两个版本的 mmseg4j,1.7 版比较耗内存(一个词库目录就要 50M 左右),所以在默认jvm内存大小会抛出 OutOfMemoryErroy。我这里示例两个词库目录,所以不用目前最新版 1.7.2。而用 1.6.2 版。下载:mmseg4j-1.6.2 和 词库,或就下载一个源码包(包括了词库,从源码构建请看:中文分词 mmseg4j 1 阅读全文
posted @ 2009-09-16 11:17 searchDM 阅读(687) 评论(0) 推荐(0) 编辑
摘要: 1.schema.xml注意确定文档唯一性的field的indexed属性必须为truesolrconfig.xml 1.注释 <dataDir>${solr.data.dir:./solr/data}</dataDir>,否则索引目录的根是当前目录,即tomcat的bin目录。 阅读全文
posted @ 2009-09-16 11:12 searchDM 阅读(490) 评论(0) 推荐(0) 编辑
摘要: Data-config为solr的data-import处理器配置数据来源。 依次按照如下树状结构: <dataConfig><dataSource name="tdp" type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost/dbname" user="root" password="85TIANJIAOyinmi"/> <!--更多dat 阅读全文
posted @ 2009-09-16 11:11 searchDM 阅读(465) 评论(0) 推荐(0) 编辑
摘要: 最近开发,使用了solr,发现这个东东真是方便。很早就听说了,但是一直觉得配置较难,而且需要学习封装后的组件本来就要费时间,所以知道将lucene弄个熟练后才开始学习solr。 最近写了这样的一段代码, view plaincopy to clipboardprint?·········10········20········30· 阅读全文
posted @ 2009-09-16 11:11 searchDM 阅读(700) 评论(0) 推荐(0) 编辑
摘要: 开发配置solr的multicore, 在solr的安装包,example下有个multicore,把该文件下的所有文件,包括solr.xml,都拷贝到已经配置好的solr.home目录下。参考(原文地址:http://lianj-lee.javaeye.com/blog/425414): 1》找到solr下载包中的example文件夹,在它的下面有个multicore文件夹,将这个文件夹下面的所有东西copy到 c:"solr-tomcat"solr下面。 注意:有一个 solr.xml(这只是默认文件,当然也可以指定别的文件),如: Xml代码 <?xmlvers 阅读全文
posted @ 2009-09-16 11:10 searchDM 阅读(730) 评论(0) 推荐(0) 编辑
摘要: 近期在开发时候需要将商品按照某些属性归类,lucene是很难做到了,自己开发效率不能够保证,于是想到使用solr。一直认为solr配置比较复杂,使用也不容易上手,网上中文资料极少,将自己的摸索成果记下来,供大家分享。 solr在schema.xml中配置defaultSearchField,即为默认搜索的域,要想在多个域中搜索,需要将这些域复制到同一个域 中,一般就这些域复制到默认搜索的域,在schema.xml中配置copyFiled,注意被目的域的multiValued属性药设置为true。 阅读全文
posted @ 2009-09-16 11:07 searchDM 阅读(705) 评论(0) 推荐(0) 编辑