大数据-第一篇-概论


JAVA =====> 面向对象编程语言
Linux =====> 类Unix操作系统

Hadoop生态
HDFS =====> 解决存储问题
MapReduce =====> 解决计算问题
Yarn =====> 资源协调者
Zookeeper =====> 分布式应用程序协调服务
Flume =====> 日志收集系统
Hive =====> 基于Hadoop的数仓工具
HBase =====> 分布式、面向列的开源数据库
Sqoop =====> 数据传递工具
Scala =====> 多范式编程语言、面向对象和函数式编程的特性
Spark =====> 目前企业常用的批处理离线/实时计算引擎
Flink =====> 目前最火的流处理框架、既支持流处理、也支持批处理
Elasticsearch =====> 大数据分布式弹性搜索引擎
Docker =====>Docker 是一个开源的应用容器。

posted @ 2020-05-19 15:16  smallfishy  阅读(120)  评论(0编辑  收藏  举报