摘要:
hadoop(离线数据分析处理) Spark 实时数据 1. 构建Hadoop集群 2. HDFS操作与编程 3. MapReduce程序设计及优化 4. MapReduce高级应用及 1. 方便 hadoop的优势: 2. 弹性 易扩展和卸载 3. 健壮 自动恢复和监测 4. 简单 编写并行分布式 阅读全文
posted @ 2019-11-19 14:41
hwloser
阅读(234)
评论(0)
推荐(0)
摘要:
HDFS架构 Block数据块: 1. 基本存储单位,一般为64M(配置大的快主要是因为: 1) 减少搜寻时间,一般硬盘传输速率比寻道时间快,大的块可以减少寻道时间; 2) 减少管理块的数据开销,每个块都需要在NameNode上有对应的记录 3) 对数据块进行读写,减少建立网络的连接成本 2. 一个 阅读全文
posted @ 2019-11-19 14:39
hwloser
阅读(327)
评论(0)
推荐(0)

浙公网安备 33010602011771号