windows下安装spark
1、安装jdk

2、安装scala

3、下载spark
3.1安装spark
- 将下载的文件解压到一个目录,注意目录不能有空格,比如说不能解压到C:\Program Files
- 作者解压到了这里,

- 将spark的bin路径添加到path中

- cmd输入spark-shell,成功安装啦,有个报错是因为还没安装Hadoop,

4、安装hadoop
-
由于spark版本为spark-2.3.3-bin-hadoop2.7,我们选择下2.8.5版本的Hadoop
hadoop下载地址

-
解压

-
添加环境变量,新建一个HADOOP_HOME

-
在path添加

-
到此运行spark-shell还会有没安装的时候那个报错,接下来需要替代Hadoop里的bin文件来解决这个错。
5、下载winutils
- 下载地址
- 笔者用的是hadoop2.8.5版本的,下载的winutils上hadoop2.8.3版本的bin,实测也是可行的。

- 接下来将bin替换原来Hadoop中的bin
6、运行spark-shell成功啦

如果你有问题,欢迎给我留言。
如果这篇博客对你有帮助,请给我一个赞👍
Life is fantastic..


浙公网安备 33010602011771号