摘要: 来自官网的Spark Programming Guide,包括个人理解的东西。 这里有一个疑惑点,pyspark是否支持Python内置函数(list、tuple、dictionary相关操作)?思考加搜索查询之后是这么考虑的:要想在多台机器上分布式处理数据,首先需要是spark支持的数据类型(要使 阅读全文
posted @ 2017-10-13 15:10 小熊_看看 阅读(417) 评论(0) 推荐(0) 编辑