摘要: 1 使用单机local模式提交任务 local模式也就是本地模式,也就是在本地机器上单机执行程序。使用这个模式的话,并不需要启动Hadoop集群,也不需要启动Spark集群,只要有一台机器上安装了JDK、Scala、Spark即可运行。 进入到Spark2.1.1的安装目录,命令是: 执行命令,用单 阅读全文
posted @ 2018-09-28 14:57 大嗯呐丶 阅读(1965) 评论(0) 推荐(0) 编辑
摘要: Hive是什么1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;4)允许用Java开发自 阅读全文
posted @ 2018-09-28 13:53 大嗯呐丶 阅读(787) 评论(0) 推荐(0) 编辑
摘要: Hive的几种常见的数据导入方式这里介绍四种:(1)、从本地文件系统中导入数据到Hive表;(2)、从HDFS上导入数据到Hive表;(3)、从别的表中查询出相应的数据并导入到Hive表中;(4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。 一、从本地文件系统中导入数据到Hi 阅读全文
posted @ 2018-09-28 11:35 大嗯呐丶 阅读(5228) 评论(0) 推荐(0) 编辑