王韦钧 - 博客园

2020年12月

摘要：一、hive用本地文件进行词频统计 1.准备本地txt文件 1 2 echo "hadoop hbase" > f1.txt echo "hadoop hive" > f2.txt 2.启动hadoop，启动hive 3.创建数据库，创建文本表 use hive（创建数据库，选择数据库） creat 阅读全文

posted @ 2020-12-06 21:26 王韦钧阅读(201) 评论(0) 推荐(0)

2020年11月

Hbase操作与编程使用

摘要：（1）createTable(String tableName, String[] fields)创建表。 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; 阅读全文

posted @ 2020-11-21 22:19 王韦钧阅读(160) 评论(0) 推荐(0)

2020年10月

作业5

摘要：阅读全文

posted @ 2020-10-24 21:49 王韦钧阅读(82) 评论(0) 推荐(0)

Hadoop安装与 HDFS体系结构

摘要：阅读全文

posted @ 2020-10-17 17:51 王韦钧阅读(86) 评论(0) 推荐(0)

作业3

摘要：阅读全文

posted @ 2020-10-09 16:32 王韦钧阅读(91) 评论(0) 推荐(0)

2020年9月

作业2

摘要： 1.Apache Hadoop是apache提供的官方版本，以yarn框架的出现为标志分为Hadoop第一代和Hadoop第二代，第一代的Hadoop包含三个大版本：0.20.x 、0.21.x 、0.22.x，其中除了0.20.x(后来演变为了1.0.x版本)是稳定的版本之外，其他的皆为不稳定版本阅读全文

posted @ 2020-09-18 09:50 王韦钧阅读(186) 评论(0) 推荐(0)

作业1

摘要： 1.了解微信、微博、小视频每天产生的数据量与数据类型微博每天产生4亿+的数据量，数据类型为byte 微信每天有450亿的消息发送，数据类型为byte 小视频每天有上千万的小视频，数据类型为byte 2.选择一个你感兴趣的领域应用数据思维进行分析决策的案例。随着智能电网的发展，电力公司可以掌握海量阅读全文

posted @ 2020-09-11 11:44 王韦钧阅读(187) 评论(0) 推荐(0)

公告