摘要: 1.使用solrj只做add操做, 不需要commit, commit操作由solr配置文件中的softcommit和hardcommit控制即可 2.solrj在对doc执行commit时可以设置延期commit时间 阅读全文
posted @ 2018-01-23 19:45 車輪の唄 阅读(9) 评论(0) 推荐(0)
摘要: 步子迈的有点大, 结果基础不牢 之前ik分词器打包直接使用run as -> maven install 方式,到maven仓的对应位置生成的jar直接应用, 一直没有问题 今天ik分词器新增了pinyin过滤器, 结果打包没有异常, solr的控制台在分词时会报异常class not define 阅读全文
posted @ 2018-01-23 17:39 車輪の唄 阅读(50) 评论(0) 推荐(0)
摘要: Lucene Analyzer包含两个核心组件,Tokenizer以及TokenFilter。两者的区别在于,前者在字符级别处理流,而后者则在词语级别处理流。Tokenizer是Analyzer的第一步,其构造函数接收一个Reader作为参数,而TokenFilter则是一个类似拦截器的东东,其参数 阅读全文
posted @ 2018-01-23 15:03 車輪の唄 阅读(20) 评论(0) 推荐(0)
摘要: 分词这块内容往往是做搜索的入门级内容,例如我们刚接触搜索的时候,经常会碰到“想要检索的检索不到”的问题,这时得对分词有个大概的了解了。 这里是简要分析,因此我用的是lucene1.9来分析(目前看的源码主要也是1.9版本,虽然都快出4.0了) 一)体系结构 首先我们了解两组类结构,一是Analyze 阅读全文
posted @ 2018-01-23 15:00 車輪の唄 阅读(27) 评论(0) 推荐(0)