大数据技术--Hive数据仓库的安装
Hive不支持OLTP(联机事务处理)所需的关键功能,更接近于一个OLAP(联机分析处理)工具。Hive提供了类似SQL语言的HQL(Hive查询语言),可进行静态数据查询。
说明:Hive是架构在Hadoop之上(准确的说是架构在HDFS之上),在安装Hive之前要先保证Hadoop已经安装成功。
实验工具 {
Hive版本:apache-hive-2.1.0-bin.tar.gz
mysql jdbc包:mysql-connector-java-5.1.46.tar.gz
}
实验步骤:
1.1 安装hive
sudo tar -zxvf ~/Downloads/apache-hive-2.1.0-bin.tar.gz -C /usr/local # 解压到/usr/local中 cd /usr/local/
sudo mv apache-hive-2.1.0-bin hive # 将文件夹名改为hive sudo chown -R hadoop:hadoop hive # 修改文件权限
1.2 配置环境变量
vim ~/.bashrc #打开.bashrc文件
#在其中添加下面三行 export HIVE_HOME=/usr/local/hive export PATH=$PATH:$HIVE_HOME/bin export HADOOP_HOME=/usr/local/hadoop source ~/.bashrc #使配置文件生效
1.3 修改 hive.site.xml
cd /usr/local/hive/conf mv hive-default.xml.template hive-default.xml #修改文件名 cd /usr/local/hive/conf vim hive-site.xml #打开配置文件
将下面的全部添加到打开的 xml 文件中,并保存退出
<?xml version="1.0" encoding="UTF-8" standalone="no"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value> <description>JDBC connect string for a JDBC metastore</description> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> <description>Driver class name for a JDBC metastore</description> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive</value> <description>username to use against metastore database</description> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>hive</value> <description>password to use against metastore database</description> </property> </configuration>
2.1 安装mysql(安装结束会提示设置密码,但也可能不提示,这就要到它的配置文件里去找默认密码)
sudo apt-get update #更新软件源 sudo apt-get install mysql-server #安装mysql
2.2 启动MySQL服务(service mysql stop 为停止服务)
service mysql start
sudo netstat -tap | grep mysql #若出现LISTEN则表示启动成功
2.3 解决以后可能出现的乱码问题
sudo vi /etc/mysql/mysql.conf.d/mysqld.cnf character_set_server=utf8 # 将这条配置语句添加到【mysqld】中,可以添加到等于以后的第一行,然后保存退出 service mysql restart #重启服务
2.4 解压 mysql-connector-java-5.1.46.tar.gz
tar -zxvf mysql-connector-java-5.1.46.tar.gz #解压
cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar /usr/local/hive/lib #将mysql-connector-java-5.1.46-bin.jar拷贝到/usr/local/hive/lib目录下
2.5 登陆mysql
service mysql start #启动mysql服务
mysql -u root -p #登陆shell界面,后面会提示输入密码
2.6创建hive数据库,并配置MySQL允许接入hive。(以下操作都是在MySQL里)
create database hive; grant all on *.* to hive@localhost identified by 'hive'; #这里’hive‘ 为密码,对应hive.site.xml里所设置的 flush privileges; #刷新MySQL里的权限关系表
3.启动hive
start-all.sh #启动hadoop hive #启动hive,这里使配置了PATH后则可以这样启动,若没有还得在hive所在目录下启动
4.可能由于版本原因,导致无法启动,则可输入下面命令
schematool -dbType mysql -initSchema
hive #再执行一次hive命令就可以进入hive了
参考资料
hive编程指南
http://www.dblab.xmu.edu.cn/blog

浙公网安备 33010602011771号