摘要: 下图是语汇单元的生成过程: 从一个Reader字符流开始,创建基于Reader的Tokenizer分词器,经过三个TokenFilter生成语汇单元Tokens。 要看分词器的分析效果,只需要看Tokenstream中的内容就可以了。每个分词器都有一个方法tokenStream,返回一个tokenS 阅读全文
posted @ 2019-02-15 15:55 MichaelKai 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 1. Lucene的下载 Lucene是开发全文检索功能的工具包,从官网下载Lucene4.10.3并解压。 官网:http://lucene.apache.org/ 版本:lucene7.7.0 (学习上没必要最新的,因为企业中也不会升级太快) Jdk要求:1.7以上 2.使用的jar包 核心包 阅读全文
posted @ 2019-02-15 14:38 MichaelKai 阅读(427) 评论(0) 推荐(0) 编辑