会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
私人小院
博客园
首页
新随笔
联系
订阅
管理
03_MapReduce框架原理_3.3 切片与 MapTask并行度
Hadoop
3. 切片 与 MapTask并行度
1. MapTask并行度
切片数 = MapTask 任务数(并行度)
0 . 术语
1. 数据块(Block)
2. 数据切片(Split)
1. Block是 HDFS物理上把数据文件分成一块一块
1. 数据切片只是在
逻辑上对输入数据进行分片
并不会在磁盘上将其切分成片存储
2.
Block是 HDFS存储数据单位
2.
数据切片是MapReduce程序 输入数据的单位
一个切片会对应启动一个MapTask任务
3. 什么时候对输入文件 切片
1. 客户端 提交Job时
posted @
2021-12-19 17:53
学而不思则罔!
阅读(
47
) 评论(
0
)
收藏
举报
刷新页面
返回顶部
公告