大数据技术--Hive数据仓库的安装

  Hive不支持OLTP(联机事务处理)所需的关键功能,更接近于一个OLAP(联机分析处理)工具。Hive提供了类似SQL语言的HQL(Hive查询语言),可进行静态数据查询。

说明:Hive是架构在Hadoop之上(准确的说是架构在HDFS之上),在安装Hive之前要先保证Hadoop已经安装成功。

实验工具 {

Hive版本:apache-hive-2.1.0-bin.tar.gz

mysql jdbc包:mysql-connector-java-5.1.46.tar.gz

}

实验步骤:

1.1 安装hive

sudo tar -zxvf ~/Downloads/apache-hive-2.1.0-bin.tar.gz -C /usr/local   # 解压到/usr/local中
cd /usr/local/
sudo mv apache-hive-2.1.0-bin hive # 将文件夹名改为hive sudo chown -R hadoop:hadoop hive # 修改文件权限

 1.2 配置环境变量

vim ~/.bashrc   #打开.bashrc文件

#在其中添加下面三行 export HIVE_HOME
=/usr/local/hive export PATH=$PATH:$HIVE_HOME/bin export HADOOP_HOME=/usr/local/hadoop source ~/.bashrc #使配置文件生效

 1.3 修改 hive.site.xml

cd /usr/local/hive/conf
mv hive-default.xml.template hive-default.xml   #修改文件名

cd /usr/local/hive/conf
vim hive-site.xml   #打开配置文件

 将下面的全部添加到打开的 xml 文件中,并保存退出

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
    <description>JDBC connect string for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
    <description>Driver class name for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>hive</value>
    <description>username to use against metastore database</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>hive</value>
    <description>password to use against metastore database</description>
  </property>
</configuration>

 2.1 安装mysql(安装结束会提示设置密码,但也可能不提示,这就要到它的配置文件里去找默认密码)

sudo apt-get update  #更新软件源
sudo apt-get install mysql-server  #安装mysql

 2.2  启动MySQL服务(service mysql stop 为停止服务)

service mysql start
sudo netstat -tap | grep mysql #若出现LISTEN则表示启动成功

 2.3  解决以后可能出现的乱码问题

sudo vi /etc/mysql/mysql.conf.d/mysqld.cnf  

character_set_server=utf8  # 将这条配置语句添加到【mysqld】中,可以添加到等于以后的第一行,然后保存退出

service mysql restart  #重启服务

 2.4 解压 mysql-connector-java-5.1.46.tar.gz

tar -zxvf mysql-connector-java-5.1.46.tar.gz #解压

cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar /usr/local/hive/lib #将mysql-connector-java-5.1.46-bin.jar拷贝到/usr/local/hive/lib目录下

 2.5 登陆mysql

service mysql start #启动mysql服务
mysql -u root -p  #登陆shell界面,后面会提示输入密码

 2.6创建hive数据库,并配置MySQL允许接入hive。(以下操作都是在MySQL里)

create database hive;

grant all on *.* to hive@localhost identified by 'hive';  #这里’hive‘ 为密码,对应hive.site.xml里所设置的

flush privileges; #刷新MySQL里的权限关系表

 3.启动hive

start-all.sh #启动hadoop
hive  #启动hive,这里使配置了PATH后则可以这样启动,若没有还得在hive所在目录下启动

  4.可能由于版本原因,导致无法启动,则可输入下面命令

schematool -dbType mysql -initSchema
hive #再执行一次hive命令就可以进入hive了

 

参考资料

hive编程指南
http://www.dblab.xmu.edu.cn/blog

 

posted @ 2020-03-21 17:24  Keepcharm  阅读(157)  评论(0)    收藏  举报