摘要:
【Hadoop Pipes】 1、MapContext的getInputSplit()可以用于获取当前mapper所对象的文件路经,也就是Pipes中,没有InputSplit接口/对象。 2、在Pipes中,不需要也没法自实现InputFormat及InputSplit。我们所能做的只有,实现一个RecordReader(用以把自己定义文件数据转换成为Key&value),需要在构造函数中根据MapContext获取文件名(路径),然后打开读取,并实现RecordReader接口。 注意: 1)TextInputFormatis the defaultInputFormat. 2). 阅读全文
posted @ 2013-10-07 23:51
Tekkaman
阅读(555)
评论(0)
推荐(0)
浙公网安备 33010602011771号