摘要:
多路输出 这个案例的意思是输出结果不是都放在同一个文件里 本案例要求同一个id的 所有商品在同一个目录下,不同id在不同目录下,这些目录都在KeySpilt下 除此之外还需要将所有商品的信息都备份一份放在AllPart目录下 (1)mapper类 package com.simple; import 阅读全文
posted @ 2025-04-07 00:45
Annaprincess
阅读(26)
评论(0)
推荐(0)
摘要:
数据分析 本例:求同一个小时内的用户数量 其实就是通过mapreduce将同一小时数的用户进行合并 (1)mapper类 import java.io.IOException; import java.net.URI; import java.util.HashMap; import org.apa 阅读全文
posted @ 2025-04-07 00:21
Annaprincess
阅读(26)
评论(0)
推荐(0)
摘要:
数据转换 就是将原数据整理成想要的格式,和数据清洗有点像! 比如:本案例 数据转换前: 每一列对应的含义:ip、时间、url 数据转换后: 详细代码如下: 代码思路和数据清洗一样 package com.simple.mr; import java.io.IOException; import ja 阅读全文
posted @ 2025-04-07 00:08
Annaprincess
阅读(30)
评论(0)
推荐(0)

浙公网安备 33010602011771号