会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一字千金
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
23
24
25
26
27
28
29
30
31
···
39
下一页
2020年1月30日
8.1 Mapreduce输入输出类型
摘要: 1.1 Mapreduce输入输出类型 (1)map和reduce输入输出类型一致性 Map输入输出类型可以不用,但是map的输出和reduce的输入类型要一致,reduce的输入输出也可不一样。 Map(K1,V1)àlist(K2,V2) Reduce (K2,list(V2))->list(K
阅读全文
posted @ 2020-01-30 09:53 一字千金
阅读(1325)
评论(0)
推荐(0)
2020年1月26日
7.4mapreduce任务执行--环境配置、推测执行、outputCommter提交协议
摘要: 1.1 任务的执行 1.1.1 任务执行环境 Map和reduce的任务会有一些属性,创建任务时传入,可以通过任务的函数(旧版configure()函数)或者对象方法获取这些属性。 1.1.2 推测执行 一个作业被分解为多个任务,并发的执行多个任务,提高速度,但是如果某个任务执行的慢就会拖后腿,所以
阅读全文
posted @ 2020-01-26 10:28 一字千金
阅读(497)
评论(0)
推荐(0)
2020年1月24日
7.3 Shuffle过程和排序
摘要: 1.1 Shuffle和排序 Shuffle:系统执行排序,将map输出作为输入传给reduce的过程称为shuffle。 1.1.1 Map端缓存排序输出 (1) 写入缓冲区:map输出结果先输出到内存缓冲区(默认100M,通过属性mapreduce.Task.io.sort.mb设置) (2)
阅读全文
posted @ 2020-01-24 15:07 一字千金
阅读(837)
评论(0)
推荐(0)
注册表的操作1314错误原因权限问题
摘要: 注册表的操作 1.注册表的作用 注册表是windows系统的数据库,保存了系统、用户、程序的信息,通过修改注册表可以对系统进行设置,可以获取程序信息、用户信息等,可以修改环境变量,可以设置程序开机自启动,修改主页,取消运行、重启、关机、注销按钮等。只要你知道注册表中对应键和键值的功能了解,就可以通过
阅读全文
posted @ 2020-01-24 15:04 一字千金
阅读(911)
评论(0)
推荐(0)
linux makefile编写 dump分析 GDB调试 抓包
摘要: Linux快速开发 1 Makefile编写... 1 1.1 实例解析... 1 1.1.1 makefile文件... 1 1.1.2 包含的makefile.global 3 1.2 使用makefile文件... 5 2 Linux编译... 5 2.1 Linux编译步骤... 5 3 L
阅读全文
posted @ 2020-01-24 15:01 一字千金
阅读(703)
评论(0)
推荐(0)
7.3.3mapreduce配置调优
摘要: 1.1.1 配置调优 通过调节配置参数,达到较优的性能。Map配置参数 属性 类型 默认值 作用 mapreduce.Task.io.sort.mb Int 100 Map输出结果的缓冲区大小兆为单位 mapreduce.map.sort.spill.percent Float 80 缓冲区占用比例
阅读全文
posted @ 2020-01-24 15:00 一字千金
阅读(351)
评论(0)
推荐(0)
2020年1月17日
7.2 hadoop失败:任务失败、application master 失败、节点管理器失败、资源管理器失败
摘要: 1.1 失败 1.1.1 任务失败 Map和reduce任务失败:Map或者reduce任务有缺陷,抛出异常,JVM会会向applicationmaster 发出错误报告,applicationmaster将任务标记为failed,将错误报告写入用户日志,释放资源。 Stream任务失败:Strea
阅读全文
posted @ 2020-01-17 08:43 一字千金
阅读(1361)
评论(0)
推荐(0)
2020年1月14日
7.1mapreduce 的工作机制任务流程执行步骤
摘要: 1.1 Mapreduce任务流程 Mapreduce是大量数据并发处理的编程模型,主要包括下面五个实体,客户端将作业文件复制到分布式文件系统,向资源管理器提交mapreduce作业,资源管理器向节点管理器分配容器资源,节点管理器启动application Master,application ma
阅读全文
posted @ 2020-01-14 16:22 一字千金
阅读(1312)
评论(0)
推荐(0)
2020年1月9日
6.7 Mapreduce作业流JobControl和Oozie
摘要: 1.1 Mapreduce作业流JobControl和Oozie 更复杂的任务,需要多个mapreduce作业,形成作业流,而不是增加map和reduce的复杂度。复杂问题,可以用高级语言pig、hive、cascading、crunch、spark。 1.1.1 问题分解成mapreduce作业流
阅读全文
posted @ 2020-01-09 16:34 一字千金
阅读(403)
评论(0)
推荐(0)
2020年1月8日
6.6 hadoop作业调优
摘要: 提高速度和性能。可以从下面几个点去优化 可以在本地运行调试来优化性能,但是本地和集群是完全不同的环境,数据流模式也截然不同,性能优化要在集群上测试。有些问题如(内存溢出)只能在集群上重现。 HPROF任务分析工具,使用下面命令启动jdk自带的分析工具,提供CPU和堆栈使用情况。 % hadoop j
阅读全文
posted @ 2020-01-08 21:04 一字千金
阅读(113)
评论(0)
推荐(0)
上一页
1
···
23
24
25
26
27
28
29
30
31
···
39
下一页
公告