摘要:
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。 主要由Split、Map、Partition、Sort、Combine(需要自己写)、Merge、Reduce组成,一般来说Split、Partition、Sort、Merge不需要工程师编程但是可以改写,主要是写出Map 阅读全文
posted @ 2019-11-05 20:32
陌默安
阅读(259)
评论(0)
推荐(0)
摘要:
Map/Reduce编程作业 现有student.txt和student_score.txt。将两个文件上传到hdfs上。使用Map/Reduce框架完成下面的题目 student.txt 2016001,王毅 2016002,张小明 2016003,李学彭 2016004,王东 2016005,王 阅读全文
posted @ 2019-11-05 19:43
陌默安
阅读(2176)
评论(1)
推荐(0)
摘要:
错误: Caused by: java.lang.ClassCastException: class java.lang.Double cannot be cast to class org.apache.hadoop.io.WritableComparable (java.lang.Double 阅读全文
posted @ 2019-11-05 19:03
陌默安
阅读(1576)
评论(0)
推荐(0)