摘要:
阅读全文
摘要:
1.任务: 列出HBase所以的表的相关信息,例如表名; 在终端打印出指定的表的所有记录数据 向已经创建好的表添加和删除指定的列族或列 清空指定的表的所有记录数据 统计表的行数 2.关系型数据库中的表和数据(教材P92上),要求将其转换为适合于HBase存储的表并插入数据。 3.编程完成以下指定功能 阅读全文
摘要:
下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 编写map与reduce函数 本地测试map与reduce 将文本数据上传至HDFS上 用hadoop streaming提交任务 查看运行结果 计算结果取回到本地 阅读全文
摘要:
1.用自己的图,描述HDFS体系结构、工作原理与流程。 图1.体系结构 图2.工作原理 图3.写数据 图4.读数据 2.伪分布式安装Hadoop。 阅读全文
摘要:
1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现 Apache hadoop 的2.0版本:hadoop通用模块,支持其他hadoop模块的通用工具集;Hadoop分布式文件系统,支持对应数据高吞吐量访问的分布式文件系统;用于作业调度和集群资源管理的Hadoop YANRN框架;Hado 阅读全文
摘要:
了解微信、微博、小视频每天产生的数据量与数据类型。 2019年,抖音日活跃用户数超过 4 亿。46 万个家庭用抖音拍摄全家福、父母们每天在抖音拍下 308 万支视频记录与孩子相处的温馨日常。2019 年在抖音有 176 万次迎接新生、18 万次高考、38 万次毕业、709 万人分享婚礼。这样一算估计 阅读全文