摘要: Hive中metastore(元数据存储)的三种方式:内嵌Derby方式Local方式Remote方式[一]、内嵌Derby方式这个是Hive默认的启动模式,一般用于单元测试,这种存储方式有一个缺点:在同一时间只能有一个进程连接使用数据库。hive-site.xml中jdbc URL、驱动、用户名、... 阅读全文
posted @ 2015-06-02 11:48 数据手艺人 阅读(4139) 评论(0) 推荐(0)
摘要: 阅读本文章可以带着下面问题:1.与传统数据库对比,找出他们的区别2.熟练写出增删改查(面试必备)创建表:hive> CREATE TABLE pokes (foo INT, bar STRING); Creates a table called pokes with two columns, th... 阅读全文
posted @ 2015-06-02 11:33 数据手艺人 阅读(450) 评论(0) 推荐(0)
摘要: 1.没有接触,不知道这个事物是什么,所以不会产生任何问题。2.接触了,但是不知道他是什么,反正我每天都在用。3.有一定的了解,不够透彻。那么hive,1.我们对它了解多少?2.它到底是什么?3.hive和hadoop是什么关系?扩展:hbase和hive是什么关系?Hive最初是应Facebook每... 阅读全文
posted @ 2015-06-02 11:29 数据手艺人 阅读(402) 评论(0) 推荐(0)
摘要: Hive的几种常见的数据导入方式这里介绍四种:(1)、从本地文件系统中导入数据到Hive表;(2)、从HDFS上导入数据到Hive表;(3)、从别的表中查询出相应的数据并导入到Hive表中;(4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。一、从本地文件系统中导入数据到Hiv... 阅读全文
posted @ 2015-06-02 11:22 数据手艺人 阅读(1831) 评论(0) 推荐(0)
摘要: Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,... 阅读全文
posted @ 2015-06-02 11:17 数据手艺人 阅读(45359) 评论(1) 推荐(4)