随笔分类 - 大数据
摘要:一、大数据平台组件总结 1、数据存储 HDFS,HBase,Kudu等 2、数据收集和迁移 常用技术:flume,canal,sqoop,datax,waterdrop 等 3、任务调度 常用技术:azkaban,oozie,dophinscheduler,airflow 等 4、部署运维 常用技术
阅读全文
摘要:1、什么是Elasticsearch? Elasticsearch 是基于 Lucene 的 Restful 的分布式实时全文搜索引擎,每个字段都被索引并可被搜索,可以快速存储、搜索、分析海量的数据。全文检索是指对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当查询时,根据事先建立的索引进
阅读全文

浙公网安备 33010602011771号