摘要: 记录一下pyspark的一些坑 在用textFile读取文件后,我想看看有多少数据量,就想用count算一下 rdd = sc.textFile("/home/parastor/backup/datum/bus/gps/2017-07-17/*/*.gz").filter(lambda x:x!=N 阅读全文
posted @ 2021-01-28 17:29 续集h 阅读(553) 评论(0) 推荐(0)