摘要: 前言 在lucene中虽然已经提供了许多的分词器:StandardAnalyzer、CJKAnalyzer等,但在解析中文的时候都会把文中拆成一个个的单子。 毕竟老外不懂中文。这里介绍一个中文的分词器:IKAnalyre。虽然在其在分词的时候还不够完美 例如:将“高富帅,是2012年之后才有的词汇” 阅读全文
posted @ 2018-03-30 15:25 GET_CHEN 阅读(183) 评论(0) 推荐(0)
摘要: 索引和搜索流程图: 1、绿色表示索引过程,对要搜索的原始内容进行索引构建一个索引库,索引过程包括:确定原始内容即要搜索的内容->采集文档->创建文档->分析文档->素引文档2、红色表示搜索过程,从索弓库中搜索内容,搜索过程包括:用户通过搜索界面->创建查询子执行搜索,从索引库搜索->渲染搜索结果 索 阅读全文
posted @ 2018-03-30 11:44 GET_CHEN 阅读(207) 评论(0) 推荐(0)