如何用elasticsearch构架亿级数据采集系统(第1集:elasticsearch概述)

elasticsearch 是一个全文搜索引擎,近年来随着 ELK(基于elasticsearch 的日志分析系统)的流行,逐渐被大家所认可。elasticsearch 是一个基于Lucene 的搜索服务器。Lucene 是一个很出名的底层的搜索接口,但是Lucene的使用难度很高,elasticsearch对Lucene进行了一次封装,使得它对我们开发者更友好。

(一)为什么需要 elasticsearch

  • 希望搜索解决方案要高效;
  • 希望零配置和完全免费的搜索方案;
  • 希望能够简单的通过 json 和 http 与搜索引擎交互;
  • 希望我们的搜索服务器稳定;
  • 希望能够简单的将一台服务器扩展到上百台;

(二)当前使用 elasticsearch 的企业

大公司都在使用它作为搜索引擎服务

  • DELL
  • FACEBOOK
  • CISCO;
  • 微软;
  • GitHub;

(三)什么是搜索引擎

很多初学者认为,搜索可以通过像数据库那样的 like 语句做查询,那问什么还会独立出一个搜索引擎呢?

关系数据搜索的缺点

关系型数据库使用 like语句和正则表达式匹配有什么缺点;

  • 无法打分;
  • 无分布式;
  • 无法解析搜索请求;
    • 关系数据库需要自己来完成分词;
  • 效率低;
  • 分词;
posted on 2020-11-26 15:46  朱元禄  阅读(99)  评论(0编辑  收藏  举报