摘要: 1.为什么产生大数据技术? (1)数据产生方式的改变(2)人类的活动越来越依赖数据(3)各行各业也越来越依赖大数据手段来开展工作 2.为什么要学习大数据技术? 近年来,科学技术快速发展,数据分析有着很重要的地位。随着大数据在生活中的实际应用,学习大数据有着广阔的就业和发展前景。 3.简述大数据、云计 阅读全文
posted @ 2021-12-25 18:18 啊吧啊吧啊吧你好 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-11-24 13:02 啊吧啊吧啊吧你好 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS,启动Hbase 8.进入shell界面 9.停止Hbase,停止HDFS运行 阅读全文
posted @ 2021-11-11 23:29 啊吧啊吧啊吧你好 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。 1) 表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族 2) 行:每个HBase表都由若干行组成,每个行由行键(row key)来标识。 3) 列族:一个HBase表被分组成许多“列族”(Column Family 阅读全文
posted @ 2021-11-11 23:28 啊吧啊吧啊吧你好 阅读(37) 评论(0) 推荐(0) 编辑
摘要: 一、在Ubuntu系统中安装和配置Eclipse 通过filezilla将eclipse包放进Hadoop里 解压eclipse包到所选目录 打开eclipse 二、利用hadoop 的java api,向HDFS写一个文件。 创建writefile类 启动HDFS 运行写文件 在HDFS查看运行结 阅读全文
posted @ 2021-10-31 19:50 啊吧啊吧啊吧你好 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 第四次作业 1.Hadoop是一个对海量数据存储和海量数据分析计算的分布式系统。 Hadoop是道格·卡丁(Doug Cutting)创建的,Hadoop起源于开源网络搜索引擎Apache Nutch,后者本身也是Lucene项目的一部分。Nutch项目面世后,面对数据量巨大的网页显示出了架构的灵活 阅读全文
posted @ 2021-10-31 19:47 啊吧啊吧啊吧你好 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 1)切换到目录 /usr/local (2)去到目前的上层目录 (3)回到自己的主文件夹 ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 mkdir命令:新建新目录 (5)进入/tmp目录,创建一个名为a的目录,并查看有多少目录存在 (6)创建目录a1/a2/a3/a4 rmdir命令 阅读全文
posted @ 2021-10-19 08:13 啊吧啊吧啊吧你好 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-09-24 19:51 啊吧啊吧啊吧你好 阅读(15) 评论(0) 推荐(0) 编辑
摘要: .为什么产生大数据技术? 产生大数据的因素:存储成本的下降;运行、计算速度越来越快;智慧,我们渴望解放脑劳动力。 在云计算出现之前,数据存储的成本是非常高的。云计算出现后,数据存储服务衍生出了新的商业模式,集中建设数据中心大大的降低了单位计算和存储成本。随着互联网的普及及网络技术的发展,加上硬件性价 阅读全文
posted @ 2021-09-24 19:04 啊吧啊吧啊吧你好 阅读(39) 评论(0) 推荐(0) 编辑