Spark:sc.textFiles() 与 sc.wholeTextFiles() 的区别
摘要:
由于业务需要,需要将大量文件按照目录分类的方式存储在HDFS上,这时从HDFS上读取文件就需要使用 sparkcontext.wholeTextFiles(), 众所周知,sc.textFiles(path) 能将path 里的所有文件内容读出,以文件中的每一行作为一条记录的方式: 下面是使用 fo 阅读全文
posted @ 2018-05-16 19:31
Ivan_Duan
阅读(6874)
评论(3)
推荐(1)
浙公网安备 33010602011771号