• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
江南阅色
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

2018年5月20日

学习笔记(三)--Lucene分词器详解
摘要: Lucene-分词器API org.apache.lucene.analysi.Analyzer 分析器,分词器组件的核心API,它的职责:构建真正对文本进行分词处理的TokenStream(分词处理器)。通过调用它的如下两个方法,得到输入文本的分词处理器。 public final TokenSt 阅读全文
posted @ 2018-05-20 19:16 江南阅色 阅读(168) 评论(0) 推荐(0)
 
学习笔记(二)--Lucene简介
摘要: Lucene简介 最受欢迎的java开源全文搜索引擎开发工具包。提供了完整的查询引擎和索引引擎,部分文本分词引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便在目标系统中实现全文检索功能,或者是以此为基础建立起完整的全文检索引擎。 是Apache的子项 阅读全文
posted @ 2018-05-20 17:36 江南阅色 阅读(140) 评论(0) 推荐(0)
 
solr 学习笔记(一)--搜索引擎简介
摘要: 一 搜索引擎是什么一套可对大量结构化、半结构化数据、非结构化文本类数据进行实时搜索的专门软件最早应用于信息检索领域,经谷歌、百度等公司推出网页搜索而为大众广知。后又被各大电商网站采用来做网站的商品搜索。现广泛应用于各行业、互联网应用。是大型系统、网站架构师必备技能。 搜索引擎是用来解决什么问题的 专 阅读全文
posted @ 2018-05-20 15:32 江南阅色 阅读(228) 评论(0) 推荐(0)
 
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3