摘要: WhitespaceAnalyzer:分析器是通过空格来分割文本信息 SimpleAnalyzer:分析器会首先通过非字母字符来拆分文本信息,并统一转为小写格式,会去掉数字类型的字符 StopAnalyser:和SimpleAnalyzer分析器类似,但StopAnalyser会去掉一些常用单词(the、a、an..) StandardAnalyzer:是lucene最复杂的核心分析器,可以识别某些种类的语汇单元,如公司名称、Email、主机名称等,它会将语汇单元转为小写格式,并去除掉停用词和标点符号 阅读全文
posted @ 2017-03-28 16:21 小禾点点 阅读(885) 评论(0) 推荐(0) 编辑