摘要: 一、hive用本地文件进行词频统计 1.准备本地txt文件 1 2 echo "hadoop hbase" > f1.txt echo "hadoop hive" > f2.txt 2.启动hadoop,启动hive 3.创建数据库,创建文本表 use hive(创建数据库,选择数据库) creat 阅读全文
posted @ 2020-12-06 21:26 王韦钧 阅读(201) 评论(0) 推荐(0)
摘要: (1)createTable(String tableName, String[] fields)创建表。 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; 阅读全文
posted @ 2020-11-21 22:19 王韦钧 阅读(160) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-10-24 21:49 王韦钧 阅读(82) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-10-17 17:51 王韦钧 阅读(86) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-10-09 16:32 王韦钧 阅读(91) 评论(0) 推荐(0)
摘要: 1.Apache Hadoop是apache提供的官方版本,以yarn框架的出现为标志分为Hadoop第一代和Hadoop第二代,第一代的Hadoop包含三个大版本:0.20.x 、0.21.x 、0.22.x,其中除了0.20.x(后来演变为了1.0.x版本)是稳定的版本之外,其他的皆为不稳定版本 阅读全文
posted @ 2020-09-18 09:50 王韦钧 阅读(186) 评论(0) 推荐(0)
摘要: 1.了解微信、微博、小视频每天产生的数据量与数据类型 微博每天产生4亿+的数据量,数据类型为byte 微信每天有450亿的消息发送,数据类型为byte 小视频每天有上千万的小视频,数据类型为byte 2.选择一个你感兴趣的领域应用数据思维进行分析决策的案例。 随着智能电网的发展,电力公司可以掌握海量 阅读全文
posted @ 2020-09-11 11:44 王韦钧 阅读(187) 评论(0) 推荐(0)