摘要: 第1章 Hadoop数据压缩 1.1 概述 1.2 MR支持的压缩编码 压缩格式 hadoop自带? 算法 文件扩展名 是否可切分 换成压缩格式后,原来的程序是否需要修改 DEFLATE 是,直接使用 DEFLATE .deflate 否 和文本处理一样,不需要修改 Gzip 是,直接使用 DEFL 阅读全文
posted @ 2020-11-03 23:40 十一vs十一 阅读(198) 评论(0) 推荐(0)
摘要: 第1章 MapReduce概述1.1 MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。1 阅读全文
posted @ 2020-11-03 23:39 十一vs十一 阅读(197) 评论(0) 推荐(0)
摘要: 1.1 大数据概念 1.2 大数据特点(4V) 1.3 大数据应用场景 1.4 大数据发展前景 1.5 大数据部门业务流程分析 1.6 大数据部门组织结构(重点) 第2章 从Hadoop框架讨论大数据生态2.1 Hadoop是什么 2.2 Hadoop发展历史(了解) 2.3 Hadoop三大发行版 阅读全文
posted @ 2020-11-03 23:36 十一vs十一 阅读(388) 评论(0) 推荐(0)