|NO.Z.00003|——————————|^^ 部署 ^^|——|Hadoop&Impala.V03|——|Impala.v03|环境部署.v01|
一、安装Impala
### --- [交互查询工具Impala]
~~~ [Impala的安装及入门案例-安装步骤]
~~~ [Impala的安装及入门案例-配置详解]
二、集群规划
| 服务名称 | linux121 | linux122 | linux123 |
| impala-catalogd | 不安装 | 不安装 | 安装 |
| impala-statestored | 不安装 | 不安装 | 安装 |
| impala-server | 安装 | 安装 | 安装 |
### --- Impala⻆色
~~~ # impala-server:这个进程是Impala真正工作的进程,
~~~ 官方建议把impala-server安装在datanode节点,更靠近数据(短路读取),进程名impalad
~~~ # impala-statestored:健康监控⻆色,主要监控impala-server,
~~~ impala-server出现异常时告知给其它impala-server;进程名叫做statestored
~~~ # impala-catalogd :管理理和维护元数据(Hive),impala更新操作;
~~~ 把impala-server更新的元数据通知给其它impala-server,进程名catalogd
~~~ # 官方建议statestore与catalog安装在同一节点上!!
三、具体安装步骤
### --- Linux123
[root@linux123 ~]# yum install impala -y
[root@linux123 ~]# yum install impala-server -y
[root@linux123 ~]# yum install impala-state-store -y
[root@linux123 ~]# yum install impala-catalog -y
[root@linux123 ~]# yum install impala-shell -y
### --- Linux121与Linux122
[root@linux121 ~]# yum install impala-server -y
[root@linux121 ~]# yum install impala-shell -y
四、配置Impala
### --- 修改hive-site.xml
[root@linux121 ~]# vim /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
<!--指定metastore地址,之前添加过可以不用添加 -->
<property>
<name>hive.metastore.uris</name>
<value>thrift://linux121:9083,thrift://linux123:9083</value>
</property>
<property>
<name>hive.metastore.client.socket.timeout</name>
<value>3600</value>
</property>
### --- 分发Hive安装包到集群节点
[root@linux123 ~]# rsync-script /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
~~~ # OR
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux122:/opt/yanqi/servers/
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux121:/opt/yanqi/servers/
### --- Linux123启动metastore服务
~~~ # Linux123启动metastore服务
[root@linux123 ~]# nohup hive --service metastore &
~~~ # 启动hiveserver2服务
[root@linux123 ~]# nohup hive --service hiveserver2 &
~~~ # 启动linux121上metastore
[root@linux121 ~]# nohup hive --service metastore &
~~~ # 查看启动的服务
[root@linux123 ~]# ps -ef | grep RunJar
org.apache.hadoop.hive.metastore.HiveMetaStore
org.apache.hadoop.hive.metastore.hiveserver2
### --- 修改HDFS集群hdfs-site.xml配置HDFS集群的短路读取
~~~ # 什么是短路读取?
~~~ 在HDFS中通过DataNode来读取数据。
~~~ 但是,当客户端向DataNode请求读取文件时,
~~~ DataNode就会从磁盘读取该文件并通过TCP socket将数据发送到客户端。
~~~ 所谓“短路”是指Client客户端直接读取文件。
~~~ 很明显,这种情况只在客户端与数据放在同一地点(译者注:同一主机)时才有可能发生。
~~~ 短路路读对于许多应用程序会带来重大的性能提升。
### --- 短路读取:
~~~ 就是Client与DataNode属于同一节点,无需再经过网络传输数据,直接本地读取。
~~~ 要配置短路本地读,需要验证本机Hadoop是否有libhadoop.so;
### --- 进入⼀下目录:
[root@linux123 ~]# ll /opt/yanqi/servers/hadoop-2.9.2/lib/native
lrwxrwxrwx 1 root root 18 Aug 12 21:15 libhadoop.so -> libhadoop.so.1.0.0
-rwxr-xr-x 1 root root 842132 Aug 12 21:15 libhadoop.so.1.0.0
Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
——W.S.Landor
浙公网安备 33010602011771号