随笔分类 -  大数据

摘要:一、大数据平台组件总结 1、数据存储 HDFS,HBase,Kudu等 2、数据收集和迁移 常用技术:flume,canal,sqoop,datax,waterdrop 等 3、任务调度 常用技术:azkaban,oozie,dophinscheduler,airflow 等 4、部署运维 常用技术 阅读全文
posted @ 2023-11-20 23:10 奇遇yms 阅读(216) 评论(0) 推荐(0)
摘要:1、什么是Elasticsearch? Elasticsearch 是基于 Lucene 的 Restful 的分布式实时全文搜索引擎,每个字段都被索引并可被搜索,可以快速存储、搜索、分析海量的数据。全文检索是指对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当查询时,根据事先建立的索引进 阅读全文
posted @ 2023-11-18 21:32 奇遇yms 阅读(43) 评论(0) 推荐(0)