摘要: 1.任务: 列出HBase所有的表的相关信息,例如表名; 在终端打印出指定的表的所有记录数据; 向已经创建好的表添加和删除指定的列族或列; 清空指定的表的所有记录数据; 统计表的行数。 2.关系型数据库中的表和数据(教材P92上),要求将其转换为适合于HBase存储的表并插入数据。 创建表 ‘Stu 阅读全文
posted @ 2020-11-21 22:32 HHH晓露 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 1.随着这几年大数据浪潮的兴起,hadoop的各种版本也快速在国内流传和使用。当前主要的hadoop版本有以下几种: (1)Apache hadoop 的2.0版本,它的模块主要有以下几个: hadoop通用模块,支持其他hadoop模块的通用工具集; Hadoop分布式文件系统,支持对应数据高吞吐 阅读全文
posted @ 2020-09-19 21:55 HHH晓露 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 1.了解微信、微博、小视频每天产生的数据量与数据类型。 微信: 数据量:每天发送消息的数量达到450亿次,每天通过微信通话的数量达到4.1亿次,其次,每天使用视频通话的数量,比2015年增长了5.7倍。而且,在2015年时,使用视频通话的人群,以80后和90后为主,平均每次使用时长是8分钟;而到了2 阅读全文
posted @ 2020-09-12 16:56 HHH晓露 阅读(101) 评论(0) 推荐(0) 编辑