会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
啊他是
博客园
首页
新随笔
联系
订阅
管理
2020年12月6日
作业8
摘要: 1、安装hive 2安装mysql 3、词频统计
阅读全文
posted @ 2020-12-06 21:44 啊他是
阅读(92)
评论(0)
推荐(0)
2020年11月22日
作业七
摘要: 列出HBase所以的表的相关信息,例如表名; 在终端打印出指定的表的所有记录数据 向已经创建好的表添加和删除指定的列族或列 清空指定的表的所有记录数据 统计表的行数 2.关系型数据库中的表和数据(教材P92上),要求将其转换为适合于HBase存储的表并插入数据。 学生表 课程表 选课表 3.编程完成
阅读全文
posted @ 2020-11-22 21:09 啊他是
阅读(134)
评论(0)
推荐(0)
2020年11月6日
5
摘要: 下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 编写map与reduce函数 本地测试map与reduce 将文本数据上传至HDFS上 用hadoop streaming提交任务 查看运行结果 计算结果取回到本地
阅读全文
posted @ 2020-11-06 19:40 啊他是
阅读(95)
评论(0)
推荐(0)
2020年10月24日
156
摘要: 本地文件系统创建一个文件,输入带姓名学号信息。 查看新建文件所在目录 查看新建文件内容 将此文件上传到HDFS文件系统上的用户目录 HDFS上查看相应目录 HDFS上查看文件内容 HDFS上查看文件大小 删除本地1步骤创建的文件 将HDFS上的文件下载到本地 查看本地文件目录
阅读全文
posted @ 2020-10-24 00:07 啊他是
阅读(281)
评论(0)
推荐(0)
2020年10月16日
第四次作业
摘要: 一、描述HDFS体系结构、工作原理与流程。 HDFS的体系结构图 HDFS读数据的过程: 客户端会发起请求 DF向NN生成一个文件路径。NN会返回这个文件第一个Blocks所在的DN列表信息 客户端根据返回的DN列表,回选取离它最近的节点,创建Socket连接 接着第一个节点与第二个节点、第二个节点
阅读全文
posted @ 2020-10-16 23:41 啊他是
阅读(102)
评论(0)
推荐(0)
2020年9月19日
1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。 2. Hadoop生态的组成、每个组件的作用、组件之间的相互关系,以图例加文字描述呈现。 3.官网学习Hadoop的安装与使用,用文档的方式列出步骤与注意事项。 http://www.apache.org/ →Projects →Projects List →Hadoop 4.评估华为hadoop发行版本的特点与可用性。
摘要: 1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。 hadoop是生态系统,如果要和另外两个比,那也该是hadoop的mr和他们比,hadoop是批处理模型,storm是流式处理模型,spark介于二者之间,不过现在storm和spark互相在涉及对方的领域,spark出streamin
阅读全文
posted @ 2020-09-19 13:18 啊他是
阅读(394)
评论(0)
推荐(0)
2020年9月11日
1.了解微信、微博、小视频每天产生的数据量与数据类型。2.选择一个你感兴趣的领域应用数据思维进行分析决策的案例。3.大数据 人工智能 云计算 物联网 区块链的概念及相互关系。4.大数据的职业前景。
摘要: 1.两岁多的抖音短视频app正在成为国民级短视频产品,他的国内日活跃用户突破2.5亿,月活跃更是达到了5亿人的高活跃量,平均每人每月都有13.5天都在使用抖音。2.利用大数据提高商业决策水平方面的案例分析。3.大数据 人工智能 云计算 物联网 区块链这几者的关系大家讨论了其实很多次了,物联网是执行端
阅读全文
posted @ 2020-09-11 10:35 啊他是
阅读(583)
评论(0)
推荐(0)
公告