摘要:
结合其他同学和自己的笔记总结如下 什么是hive? 基于Hadoop的开源的数据仓库工具,用于处理海量结构化数据。 Hive把HDFS中结构化的数据映射成表。 Hive通过把HiveSQL进行解析和转换,最终生成一系列在hadoop上运行的mapreduce任务,通过执行这些任务完成数据分析与处理。 阅读全文
posted @ 2020-06-04 17:43
吕二口
阅读(833)
评论(0)
推荐(0)
摘要:
在本地搭建好伪分布式环境,打开虚拟机进入linux系统,如果是在root用户下则需要切换至Hadoop用户 su - hadoop 按需输入hadoop密码 在hadoop家目录下启动Hadoop集群 start-all.sh 查看进程,检查是否正常启动 jps 进入Hive安装目录 (具体目录可能 阅读全文
posted @ 2020-06-04 16:55
吕二口
阅读(591)
评论(0)
推荐(0)
摘要:
看别人的博客总是花里胡哨,早已羡慕不已,花了点时间整理了下自己博客园的背景 参考原博主链接:https://www.cnblogs.com/Penn000/p/6947472.html,https://www.cnblogs.com/Tangent-1231/p/10393759.html 以下为源 阅读全文
posted @ 2020-06-04 12:27
吕二口
阅读(1602)
评论(1)
推荐(0)
摘要:
基本含义 首先,一进入命令行就会出现 [root@localhost ~]# ,它代表的意思如下: root: 代表当前用户; localhost: 系统名字 ,没有设置系统名字的时候默认名称为 localhost; ~:所处的目录,~代表家目录下; #:是用户提示符,代表你是根用户,普通用户是$提 阅读全文
posted @ 2020-06-04 01:46
吕二口
阅读(550)
评论(0)
推荐(0)
摘要:
打开虚拟机进入linux系统 进入Hadoop目录下 多用tab键 它可以自动补齐命令 1. 启动Hadoop集群 start-all.sh 等价于 start-dfs.sh 和 start-yarn.sh 2. 关闭Hadoop集群 stop-all.sh 3. 查看启动的服务进程 jps 4. 阅读全文
posted @ 2020-06-04 00:35
吕二口
阅读(681)
评论(0)
推荐(0)

浙公网安备 33010602011771号