摘要:
1.使用solrj只做add操做, 不需要commit, commit操作由solr配置文件中的softcommit和hardcommit控制即可 2.solrj在对doc执行commit时可以设置延期commit时间 阅读全文
posted @ 2018-01-23 19:45
車輪の唄
阅读(9)
评论(0)
推荐(0)
摘要:
步子迈的有点大, 结果基础不牢 之前ik分词器打包直接使用run as -> maven install 方式,到maven仓的对应位置生成的jar直接应用, 一直没有问题 今天ik分词器新增了pinyin过滤器, 结果打包没有异常, solr的控制台在分词时会报异常class not define 阅读全文
posted @ 2018-01-23 17:39
車輪の唄
阅读(50)
评论(0)
推荐(0)
摘要:
Lucene Analyzer包含两个核心组件,Tokenizer以及TokenFilter。两者的区别在于,前者在字符级别处理流,而后者则在词语级别处理流。Tokenizer是Analyzer的第一步,其构造函数接收一个Reader作为参数,而TokenFilter则是一个类似拦截器的东东,其参数 阅读全文
posted @ 2018-01-23 15:03
車輪の唄
阅读(20)
评论(0)
推荐(0)
摘要:
分词这块内容往往是做搜索的入门级内容,例如我们刚接触搜索的时候,经常会碰到“想要检索的检索不到”的问题,这时得对分词有个大概的了解了。 这里是简要分析,因此我用的是lucene1.9来分析(目前看的源码主要也是1.9版本,虽然都快出4.0了) 一)体系结构 首先我们了解两组类结构,一是Analyze 阅读全文
posted @ 2018-01-23 15:00
車輪の唄
阅读(27)
评论(0)
推荐(0)

浙公网安备 33010602011771号