4.RDD操作
一、RDD的创建
1.从本地文件系统中加载数据创建RDD


2.从HDFS加载数据创建RDD、启动hdfs、上传文件、查看文件、加载

3.通过并行集合(列表)创建RDD

二、RDD的操作
转换操作
1.filter(func) lambda函数

显式定义函数

2.map(func)
显式定义函数
lambda函数


3.flatMap(func)


4.reduceByKey()


5.groupByKey()



6.sortByKey()

7.sortBy()

8.RDD写入文本文件
行动操作
1.foreach(print)

2.foreach(lambda a:print(a.upper())

3.collect()

浙公网安备 33010602011771号