会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangheng #这里是用户名
博客园
联系
管理
上一页
1
2
3
4
5
6
7
···
25
下一页
2021年7月15日
Hive sql
摘要: hive 架构 hive 数据类型分基本数据类型 和集合数据类型 隐式转换: hive> select '1.0'+2; // 数字字符串转double OK 3.0 hive> select '1111' > 10; hive> select 1 > 0.8; 显式转换: hive> select
阅读全文
posted @ 2021-07-15 11:59 wangheng1409
阅读(802)
评论(0)
推荐(1)
2021年6月24日
MR 自定义inputformat,outputformat
摘要: package com.lagou.mr.sequence; //自定义inputformat读取多个小文件合并为一个SequenceFile文件 //SequenceFile文件中以kv形式存储文件,key--》文件路径+文件名称,value-->文件的整个内容 import org.apache
阅读全文
posted @ 2021-06-24 17:16 wangheng1409
阅读(89)
评论(0)
推荐(0)
MapReduce 优化
摘要: Job 执行原则: 1.尽可能让任务并发执行,合理控制maptask和reducetask数量 2.尽量让所有reduceTask在同一轮完成 3.task的执行时间要合理,maptask 和reducetask的执行时间尽量靠近1min shuffle调优: Map 端调优: 查看yarn web
阅读全文
posted @ 2021-06-24 16:24 wangheng1409
阅读(215)
评论(0)
推荐(0)
2021年6月10日
MapReduce
摘要: Mapper类 : 用户自定义一个Mapper类继承Hadoop的Mapper类 Mapper的输入数据是KV对的形式(类型可以自定义) Map阶段的业务逻辑定义在map()方法中 Mapper的输出数据是KV对的形式(类型可以自定义) 注意:map()方法是对每一行数据调用一次!! Reducer
阅读全文
posted @ 2021-06-10 13:00 wangheng1409
阅读(63)
评论(0)
推荐(0)
2021年6月4日
HDFS
摘要: //IO流 操作HDFS 参考之前博客IO流文章末尾hadoop IO流操作//上传文件@Test public void putFileToHDFS() throws IOException, InterruptedException, URISyntaxException { // 1 获取文件
阅读全文
posted @ 2021-06-04 20:46 wangheng1409
阅读(67)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
25
下一页
公告