用solr做关键词检索功能

1、solr的版本

　　采用4.10.1的版本，目前solr已经更新到7.x的版本，且4.x版本后，solr升级较大。未采用最新版的原因是参考以前的代码（主要是调用solr-solrj-4.10.0.jar等jar包的api）和solr的core的xml文件配置。

2、solr的配置

(1) solr war包发布于jetty的webapps目录下

(2)solr core的配置文件放在jetty下

(3)core总体配置

#################################################
# #
# dataimport scheduler properties #
# #
#################################################

# to sync or not to sync
# 1 - active; anything else - inactive
syncEnabled=1

# which cores to schedule
# in a multi-core environment you can decide which cores you want syncronized
# leave empty or comment it out if using single-core deployment
syncCores=risk_source,risk_safe_activity,risk_patrol

# solr server name or IP address
# [defaults to localhost if empty]
server=localhost

# solr server port
# [defaults to 80 if empty]
port=1003

# application name/context
# [defaults to current ServletContextListener's context (app) name]
webapp=solr

# URL params [mandatory]
# remainder of URL
params=/dataimport?command=delta-import&clean=false&commit=true

# schedule interval
# number of minutes between two runs
# [defaults to 30 if empty]
# 增量索引的时间间隔，单位分钟
# 为空,为0,或者注释掉:表示永不增量索引
interval=2

# 重做索引的时间间隔，单位分钟，默认7200，即5天;
# 为空,为0,或者注释掉:表示永不重做索引
#reBuildIndexInterval=2

# 重做索引的参数
#reBuildIndexParams=/dataimport?command=full-import&clean=false&commit=true

# 重做索引时间间隔的计时开始时间，第一次真正执行的时间=reBuildIndexBeginTime+reBuildIndexInterval*60*1000；
# 两种格式：2012-04-11 03:10:00 或者 03:10:00，后一种会自动补全日期部分为服务启动时的日期
#reBuildIndexBeginTime=03:10:00

(4)从mysql导入数据类型的core配置

<dataConfig>
<dataSource driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/risk" user="root" password="123456" />
<document>
<entity name="risk_source" query="select t.deptid,t.parentid,t.deviceid,t.devicename,t.devicetype,t.position,t.lng,t.lat,t.devicegrade,t.remark,t.importance,t.maintain,t.weight,t.picspath,t.qrcodeid,d.DEPTNAME,t.responsible_org,c.cat_name from tdevice t left join eadept d on t.deptid=d.DEPTID left JOIN risk_device_category c on t.device_category = c.uuid where t.devicetype is not null"
deltaQuery="select deviceid from tdevice where updatetime > '${dataimporter.last_index_time}'"
deltaImportQuery="select t.deptid,t.parentid,t.deviceid,t.devicename,t.devicetype,t.position,t.lng,t.lat,t.devicegrade,t.remark,t.importance,t.maintain,t.weight,t.picspath,t.qrcodeid,d.DEPTNAME,t.responsible_org,c.cat_name from tdevice t left join eadept d on t.deptid=d.DEPTID left JOIN risk_device_category c on t.device_category = c.uuid where t.devicetype is not null and t.deviceid='${dataimporter.delta.deviceid}'"
>
<field column="deptid" name="deptid" />
<field column="parentid" name="parentid" />
<field column="deviceid" name="deviceid" />
<field column="devicename" name="devicename" />
<field column="devicetype" name="devicetype" />
<field column="position" name="position" />
<field column="lng" name="lng" />
<field column="lat" name="lat" />
<field column="devicegrade" name="devicegrade" />
<field column="remark" name="remark" />
<field column="importance" name="importance" />
<field column="maintain" name="maintain" />
<field column="weight" name="weight" />
<field column="picspath" name="picspath" />
<field column="qrcodeid" name="qrcodeid" />
<field column="DEPTNAME" name="deptname" />
<field column="responsible_org" name="responsible_org" />
<field column="cat_name" name="cat_name" />
</entity>
</document>
</dataConfig>

<?xml version="1.0" encoding="UTF-8" ?>
<schema name="risk_source" version="1.5">
<fields>

<field name="_version_" type="long" indexed="true" stored="true"/>

<field name="deptid" type="string" indexed="true" stored="true" multiValued="false" required="false" />
<field name="parentid" type="string" indexed="true" stored="true" multiValued="false" required="false" />
<field name="deviceid" type="string" indexed="true" stored="true" multiValued="false" required="true"/>
<field name="devicename" type="text_ik" indexed="true" stored="true" multiValued="false" required="true"/>
<field name="devicetype" type="string" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="position" type="text_ik" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="lng" type="double" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="lat" type="double" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="devicegrade" type="int" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="remark" type="text_ik" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="importance" type="tint" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="maintain" type="tint" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="weight" type="float" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="picspath" type="string" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="qrcodeid" type="string" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="deptname" type="text_ik" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="responsible_org" type="string" indexed="true" stored="true" multiValued="false" required="false"/>
<field name="cat_name" type="text_ik" indexed="true" stored="true" multiValued="false" required="false"/>

<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

<dynamicField name="*_i" type="int" indexed="true" stored="true"/>
<dynamicField name="*_is" type="int" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_s" type="string" indexed="true" stored="true" />
<dynamicField name="*_ss" type="string" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_l" type="long" indexed="true" stored="true"/>
<dynamicField name="*_ls" type="long" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_t" type="text_general" indexed="true" stored="true"/>
<dynamicField name="*_txt" type="text_general" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_en" type="text_en" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_b" type="boolean" indexed="true" stored="true"/>
<dynamicField name="*_bs" type="boolean" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_f" type="float" indexed="true" stored="true"/>
<dynamicField name="*_fs" type="float" indexed="true" stored="true" multiValued="true"/>
<dynamicField name="*_d" type="double" indexed="true" stored="true"/>
<dynamicField name="*_ds" type="double" indexed="true" stored="true" multiValued="true"/>

<dynamicField name="*_coordinate" type="tdouble" indexed="true" stored="false" />

<dynamicField name="*_ti" type="tint" indexed="true" stored="true"/>
<dynamicField name="*_tl" type="tlong" indexed="true" stored="true"/>
<dynamicField name="*_tf" type="tfloat" indexed="true" stored="true"/>
<dynamicField name="*_td" type="tdouble" indexed="true" stored="true"/>
<dynamicField name="*_tdt" type="tdate" indexed="true" stored="true"/>

<uniqueKey>deviceid</uniqueKey>

<types>

<fieldType name="string" class="solr.StrField" sortMissingLast="true" />
<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

<fieldType name="boolean" class="solr.BoolField" sortMissingLast="true"/>

<!--
Default numeric field types. For faster range queries, consider the tint/tfloat/tlong/tdouble types.

These fields support doc values, but they require the field to be
single-valued and either be required or have a default value.
-->
<fieldType name="int" class="solr.TrieIntField" precisionStep="0" positionIncrementGap="0"/>
<fieldType name="float" class="solr.TrieFloatField" precisionStep="0" positionIncrementGap="0"/>
<fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>
<fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" positionIncrementGap="0"/>

<fieldType name="tdate" class="solr.TrieDateField" precisionStep="6" positionIncrementGap="0"/>

<fieldtype name="binary" class="solr.BinaryField"/>

<!--
Note:
These should only be used for compatibility with existing indexes (created with lucene or older Solr versions).
Use Trie based fields instead. As of Solr 3.5 and 4.x, Trie based fields support sortMissingFirst/Last

Plain numeric field types that store and index the text
value verbatim (and hence don't correctly support range queries, since the
lexicographic ordering isn't equal to the numeric ordering)
-->
<fieldType name="pint" class="solr.IntField"/>
<fieldType name="plong" class="solr.LongField"/>
<fieldType name="pfloat" class="solr.FloatField"/>
<fieldType name="pdouble" class="solr.DoubleField"/>
<fieldType name="pdate" class="solr.DateField" sortMissingLast="true"/>

<fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
</analyzer>
</fieldType>

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />

<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

<fieldType name="text_en" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>


<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="lang/stopwords_en.txt"
/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPossessiveFilterFactory"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>

<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="lang/stopwords_en.txt"
/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPossessiveFilterFactory"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>

<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
</fieldType>

<fieldType name="text_en_splitting_tight" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_en.txt"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="1" catenateNumbers="1" catenateAll="0"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
<filter class="solr.EnglishMinimalStemFilterFactory"/>

<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
</fieldType>

<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

<fieldType name="text_general_rev" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.ReversedWildcardFilterFactory" withOriginal="true"
maxPosAsterisk="3" maxPosQuestion="2" maxFractionAsterisk="0.33"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

<fieldType name="alphaOnlySort" class="solr.TextField" sortMissingLast="true" omitNorms="true">
<analyzer>

<tokenizer class="solr.KeywordTokenizerFactory"/>

<filter class="solr.LowerCaseFilterFactory" />

<filter class="solr.TrimFilterFactory" />

<fieldType name="lowercase" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.KeywordTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>

<fieldType name="descendent_path" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.PathHierarchyTokenizerFactory" delimiter="/" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.KeywordTokenizerFactory" />
</analyzer>
</fieldType>

<fieldType name="ancestor_path" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.KeywordTokenizerFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.PathHierarchyTokenizerFactory" delimiter="/" />
</analyzer>
</fieldType>

<fieldtype name="ignored" stored="false" indexed="false" multiValued="true" class="solr.StrField" />

<fieldType name="location" class="solr.LatLonType" subFieldSuffix="_coordinate"/>

</types>
</schema>

(5)从文件导入的core

3、solr的检索语法

posted @ 2019-04-06 18:09 npng09 阅读(1206) 评论(0) 收藏举报

刷新页面返回顶部

npng09

用solr做关键词检索功能

公告