摘要: 1.1.1 Stream 作业 (1)hadoop streaming Hadoop streaming是hadoop的一个工具,用于运行费java的maper或reducer作业,例如maper和reducer是C++编写的可执行程序或者脚本文件。同时也可以是java类。 HADOOP_HOME/ 阅读全文
posted @ 2020-01-30 09:58 一字千金 阅读(566) 评论(0) 推荐(0)
摘要: 1.1.1 默认的map函数和reduce函数 (1)Maper和Reuducer默认类 如果没有指定maper类和reduce类,则会用默认的Maper和Reuducer类去处理数据。也可以显示的将处理类设置为Maper和Reducer类。默认的Maper类和reduce类是将输入原封不动的输出。 阅读全文
posted @ 2020-01-30 09:56 一字千金 阅读(376) 评论(0) 推荐(0)
摘要: 1.1 Mapreduce输入输出类型 (1)map和reduce输入输出类型一致性 Map输入输出类型可以不用,但是map的输出和reduce的输入类型要一致,reduce的输入输出也可不一样。 Map(K1,V1)àlist(K2,V2) Reduce (K2,list(V2))->list(K 阅读全文
posted @ 2020-01-30 09:53 一字千金 阅读(1325) 评论(0) 推荐(0)