2.安装Spark与Python练习
一、安装Spark
- 检查基础环境hadoop,jdk

2.下载spark
已安装,故省略!
3.解压,文件夹重命名、权限
已安装,故省略!
4.配置文件
![]()
5.配置环境变量

6.启动pyspark

7.测试pyspark:

二、Python编程练习:英文文本的词频统计
1.需处理文本内容:

2.处理文本的py代码:

3.处理结果:

一、安装Spark

2.下载spark
已安装,故省略!
3.解压,文件夹重命名、权限
已安装,故省略!
4.配置文件
![]()
5.配置环境变量

6.启动pyspark

7.测试pyspark:

二、Python编程练习:英文文本的词频统计
1.需处理文本内容:

2.处理文本的py代码:

3.处理结果:
