会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
王韦钧
博客园
首页
新随笔
联系
订阅
管理
2020年12月
第八次 Hive 操作与应用 词频统计
摘要: 一、hive用本地文件进行词频统计 1.准备本地txt文件 1 2 echo "hadoop hbase" > f1.txt echo "hadoop hive" > f2.txt 2.启动hadoop,启动hive 3.创建数据库,创建文本表 use hive(创建数据库,选择数据库) creat
阅读全文
posted @ 2020-12-06 21:26 王韦钧
阅读(201)
评论(0)
推荐(0)
2020年11月
Hbase操作与编程使用
摘要: (1)createTable(String tableName, String[] fields)创建表。 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration;
阅读全文
posted @ 2020-11-21 22:19 王韦钧
阅读(160)
评论(0)
推荐(0)
2020年10月
作业5
摘要:
阅读全文
posted @ 2020-10-24 21:49 王韦钧
阅读(82)
评论(0)
推荐(0)
Hadoop安装 与 HDFS体系结构
摘要:
阅读全文
posted @ 2020-10-17 17:51 王韦钧
阅读(86)
评论(0)
推荐(0)
作业3
摘要:
阅读全文
posted @ 2020-10-09 16:32 王韦钧
阅读(91)
评论(0)
推荐(0)
2020年9月
作业2
摘要: 1.Apache Hadoop是apache提供的官方版本,以yarn框架的出现为标志分为Hadoop第一代和Hadoop第二代,第一代的Hadoop包含三个大版本:0.20.x 、0.21.x 、0.22.x,其中除了0.20.x(后来演变为了1.0.x版本)是稳定的版本之外,其他的皆为不稳定版本
阅读全文
posted @ 2020-09-18 09:50 王韦钧
阅读(186)
评论(0)
推荐(0)
作业1
摘要: 1.了解微信、微博、小视频每天产生的数据量与数据类型 微博每天产生4亿+的数据量,数据类型为byte 微信每天有450亿的消息发送,数据类型为byte 小视频每天有上千万的小视频,数据类型为byte 2.选择一个你感兴趣的领域应用数据思维进行分析决策的案例。 随着智能电网的发展,电力公司可以掌握海量
阅读全文
posted @ 2020-09-11 11:44 王韦钧
阅读(187)
评论(0)
推荐(0)
公告