starplatinum777

2020年12月6日

摘要：一、hive用本地文件进行词频统计 1.准备本地txt文件 1 2 echo "hadoop hbase" > f1.txt echo "hadoop hive" > f2.txt 2.启动hadoop，启动hive 3.创建数据库，创建文本表 use hive（创建数据库，选择数据库） creat 阅读全文

posted @ 2020-12-06 20:25 starplatinum777 阅读(162) 评论(0) 推荐(0)

2020年11月22日

第七次作业

摘要： 1.任务：列出HBase所有的表的相关信息，例如表名在终端打印出指定的表的所有记录数据；向已经创建好的表添加和删除指定的列族或列；清空指定的表的所有记录数据统计表的行数 2.关系型数据库中的表和数据（教材P92上)，要求将其转换为适合于HBase存储的表并插入数据。创建表 ‘Studen 阅读全文

posted @ 2020-11-22 21:33 starplatinum777 阅读(194) 评论(0) 推荐(0)

2020年10月24日

第五次作业

摘要：本地文件系统创建一个文件，输入带姓名学号信息。 HDFS上查看文件大小删除本地1步骤创建的文件将HDFS上的文件下载到本地查看本地文件目录阅读全文

posted @ 2020-10-24 21:56 starplatinum777 阅读(51) 评论(0) 推荐(0)

2020年10月17日

第四次作业

摘要： HDFS 采用的是master/slaves主从结构模型来管理数据，这种结构模型主要由四个部分组成：Client(客户端)、Namenode(名称节点)、Datanode(数据节点)和SecondaryNamenode(第二名称节点，辅助Namenode)。一个真正的HDFS集群包括一个Nameno 阅读全文

posted @ 2020-10-17 10:53 starplatinum777 阅读(208) 评论(0) 推荐(0)

2020年10月10日

第三次作业

摘要：阅读全文

posted @ 2020-10-10 22:00 starplatinum777 阅读(59) 评论(0) 推荐(0)

2020年9月12日

作业一：大数据概述与学习资源

摘要：微信的数据量就是每天人们的聊天信息，朋友圈的图片信息以及小程序产生的数据，数据类型有 Number，Object，Array，Bool，Date，Geo这几种类型微博的的数据量是每天热搜，人们发布的微博博文，各种图片信息，数据类型有 number、varchar，date ，name 小视频的数据阅读全文

posted @ 2020-09-12 12:24 starplatinum777 阅读(126) 评论(0) 推荐(0)

公告