随笔档案「2020年6月4日」：Hive-谈谈你对Hive的认识 ... - 吕二口

2020年6月4日

摘要：结合其他同学和自己的笔记总结如下什么是hive? 基于Hadoop的开源的数据仓库工具，用于处理海量结构化数据。 Hive把HDFS中结构化的数据映射成表。 Hive通过把HiveSQL进行解析和转换，最终生成一系列在hadoop上运行的mapreduce任务，通过执行这些任务完成数据分析与处理。阅读全文

posted @ 2020-06-04 17:43 吕二口阅读(838) 评论(0) 推荐(0)

伪分布式环境下启动Hadoop下的Hive

摘要：在本地搭建好伪分布式环境，打开虚拟机进入linux系统,如果是在root用户下则需要切换至Hadoop用户 su - hadoop 按需输入hadoop密码在hadoop家目录下启动Hadoop集群 start-all.sh 查看进程，检查是否正常启动 jps 进入Hive安装目录（具体目录可能阅读全文

posted @ 2020-06-04 16:55 吕二口阅读(595) 评论(0) 推荐(0)

博客园页面美化源代码

摘要：看别人的博客总是花里胡哨，早已羡慕不已，花了点时间整理了下自己博客园的背景参考原博主链接：https://www.cnblogs.com/Penn000/p/6947472.html，https://www.cnblogs.com/Tangent-1231/p/10393759.html 以下为源阅读全文

posted @ 2020-06-04 12:27 吕二口阅读(1605) 评论(1) 推荐(0)

linux的常用命令

摘要：基本含义首先，一进入命令行就会出现 [root@localhost ~]# ，它代表的意思如下： root: 代表当前用户； localhost: 系统名字，没有设置系统名字的时候默认名称为 localhost； ~：所处的目录，~代表家目录下； #：是用户提示符，代表你是根用户，普通用户是$提阅读全文

posted @ 2020-06-04 01:46 吕二口阅读(554) 评论(0) 推荐(0)

Hadoop的shell操作

摘要：打开虚拟机进入linux系统进入Hadoop目录下多用tab键它可以自动补齐命令 1. 启动Hadoop集群 start-all.sh 等价于 start-dfs.sh 和 start-yarn.sh 2. 关闭Hadoop集群 stop-all.sh 3. 查看启动的服务进程 jps 4. 阅读全文

posted @ 2020-06-04 00:35 吕二口阅读(681) 评论(0) 推荐(0)

吕二口

学如逆水行舟不进则退

公告

吕二口

学如逆水行舟 不进则退

公告

学如逆水行舟不进则退