配置java四个环境变量,这里说明一下,如果时按照我的做的一定要和我创建的文件夹一模一样,不然不会成功
使用vim打开linux的环境变量文件
这里需要强调一下,用的那个用户编辑的下面的文件,就是那个用户的变量,我这个用的root用户的,所以就只有在root用户下才可以使用java命令
目录
一、前期准备
VMware-tools安装
基本配置
root配置
网络配置
软件源配置
二、创建hadoop用户和文件
用户创建
小插曲
三、FTP配置
四、配置java环境及安装eclipse
安装eclipse
安装java环境
五、安装hadoop
六、伪分布式配置
修改配置文件
执行名称节点格式化
启动测试
ssh免密登录设置
再次测试
一、前期准备
如果对Linux一点都不了解想要快速掌握一些基础命令的话可以看我之前的一篇,应该有帮助
https://blog.csdn.net/weixin_44495941/article/details/109523427
这里建议直接在打开虚拟机之前通过勾选安装,必须在关机时才可以勾选。

基本配置
如果按照我的配置,务必使用我使用的文件
链接:https://pan.baidu.com/s/1jpHnqGa4yXb_g25aJuHjRQ
提取码:8dvb
复制这段内容后打开百度网盘手机App,操作更方便哦
开始之初,创建虚拟机时,内存最好分配2G左右,不然图形化界面会很卡的
提醒读者,一定要注意是在什么用户下敲的命令,我在里面都有详细解释,务必认真阅读,弄错一步都有可能不成功
打开终端
桌面右击点击open in terminal或者ctrl+shift+t打开终端

查看自己版本号

修改提示主机名
root配置
修改root密码(如果开始没有创建的话)

切换为root用户方便后面操作,最后一个符号由$变为#则代表切换为了root用户(新手建议使用普通用户用sudo提权)

网络配置
查看自己的网络是否能用

第一个lo为回环地址网卡,不用管,主要是第二个ens33为你的上网地址网卡,看有没有IP地址等等,没有的话提供以下思路
1.重启网卡
2.可能是你的外面的路由器的问题,可以换成NAT模式
3.修改配置文件(由于Ubuntu的配置文件太乱了,建议直接图形化里面改,如下,都改成自动


然后再回到命令行输入dhclient重新获取一下地址即可
如果没有vim可以先使用vi,命令一样进入后按i进入编辑模式后右键paste黏贴进入,再shift加两下z(两下大写z)保存退出
之后一个命令导入配置文件

之后就可以下载安装常用编辑器,我本人喜欢用vim当然,新手推荐用nano有提示帮助
二、创建hadoop用户和文件
用户创建
2.创建用户并自动创建文件,指定bash为shell

由于创建过一次忘了删,所以会报文件存在的错误,但还是成功
3.创建密码

4.添加Hadoop 到hadoop组(需要注意的是usermod命令修改用户组,如下为例,第一个Hadoop为用户组名,第二个为用户名

因为以后可能会用到hadoop用户执行root才有的权限,所以将hadoop添加到sudo文件里
首先打开文件
进入后按i进入编辑模式,找到root这里在下面添加一行
然后按一下ESC键,再按住shift不放按两下Z(大写的两个Z)保存并推出vim编辑器,Hadoop用户将会拥有sudo提权的权限

保存的时候可能会报这个错

这是因为文件设置成了只读,想要强制保存退出的话先猛按ESC再输入:会在左下角有个:还有个待输入的光标闪烁,这时候输入wq!再回车就行了

按照教科书上的所有的下载的以及从主机上发过来的文件全部都放到/home/hadoop/downloads下
创建文件
小插曲
想删除用户hadoop
报错:

导致原因,频繁切换su
解决办法:
使用w查看哪些用户登录

使用who查看哪些用户使用

使用crtl+d退出用户(多使用几次退出完)
再次删除,失败
查看哪些进程在占用

直接杀死进程

再次删除,成功!
三、FTP配置
有人会有疑问,明明前面没有搭建ftp怎么会使用ftp呢。其实是使用的sftp的协议,就是ssh里面的,是linux自带的
下面使用filezilla连接


主要是需要选择这个sftp协议

点击连接,出来弹框点击确定。
四、配置java环境及安装eclipse
安装eclipse
我这里使用的是VMware虚拟机可以直接拖拽到里面,如果使用的是 VirtualBox开源虚拟机,则需要搭建一个ftp来传送,Ubuntu搭建ftp比较简单,教材上也详细,就不再赘述,这里讲一下使用VMware拖拽导致找不到文件的方法
首先拖拽eclipse

本来想直接能够复制进我打开的文件,结果并不是,这里提供一个命令直接找到文件 find
find使用方法
find path 【option】file
然后再使用mv命令移动到上面创建的hadoop下载文件夹中

之后把文件解压到/use/local下

之后进入解压文件夹并且运行eclipse即可

安装java环境
java环境包依旧放到download下,解压到创建的/usr/lib/jvm下

配置java四个环境变量,这里说明一下,如果时按照我的做的一定要和我创建的文件夹一模一样,不然不会成功
使用vim打开linux的环境变量文件
这里需要强调一下,用的那个用户编辑的下面的文件,就是那个用户的变量,我这个用的root用户的,所以就只有在root用户下才可以使用java命令
需要切换到Hadoop用户下面的可以如下教程

后面的教程相同
在开头输入如下,记得进去后先按下i进入编辑模式才可以黏贴
这里一定要和我输入的一模一样,而且使用我提供的软件包才可以,也可以使用自己的,只不过需要改一下版本号等等
输入后按两次大写的z保存退出

更新重置下环境变量文件,并检查java环境配置是否成功,出现和我一样的提示则配置成功

Java环境配置篇结束
五、安装hadoop
拖拽移动hadoop

同样需要解压到/usr/local/文件夹下

进入/usr/local/更改文件名hadoop-3.1.3为hadoop并更改文件权限为Hadoop所有

进入解压文件,验证软件是否可用

六、伪分布式配置
伪分布就是把自己的Ubuntu既当成名称节点也当成数据节点(既当爹又当妈),读取HDFS中的文件
其实就是需要更改一下配置文件,格式化一下名称节点就行了
修改配置文件
修改配置文件core-site.xml的<configuration>标签
添加如下内容(如果是按照我的教程配置的就可以直接黏贴,不然请自行斟酌文件名

同上面的方式保存退出
修改配置文件hdfs-site.xml的<configuration>标签

执行名称节点格式化
修改完配置文件只需要执行一下名称节点的格式化即可

看到如下输出的最后的提示则说明成功

启动测试
输入命令测式

报错:

初步判断式因为ssh没有配置免密登录
ssh免密登录设置
这个同样区分用户,准备用的那个用户启动hadoop就改那个用户的,本教程使用hadoop的用户启动,所有的环境变量等都需要配置这个用户,这样才可以成功!!!!
1. 生成公钥私钥,将在~/.ssh文件夹下生成文件id_rsa:私钥,id_rsa.pub:公钥

2. 导入公钥到认证文件,更改权限:
(1)导入本机:理论上需要将本机的公匙复制到服务器的authorized_keys下,但是这里只在本机登录,所以进行到这一步就可以了,
(2)导入服务器:(我只是在本机配置的,所以这一步我没做)
首先将公钥复制到服务器:
然后,将公钥导入到认证文件,这一步的操作在服务器上进行:
(3)测试:ssh localhost 第一次需要输入yes和密码,之后就不需要了。
再次测试

成功!