12 2016 档案

摘要:初识spark,需要对其API有熟悉的了解才能方便开发上层应用。本文用图形的方式直观表达相关API的工作特点,并提供了解新的API接口使用的方法。例子代码全部使用python实现。 1. 数据源准备 准备输入文件: 启动pyspark: 使用textFile创建RDD: 查看RDD分区与数据: 2. 阅读全文
posted @ 2016-12-15 23:37 Florian 阅读(5896) 评论(0) 推荐(3) 编辑