摘要:
1.为什么产生大数据技术? (1)数据产生方式的改变(2)人类的活动越来越依赖数据(3)各行各业也越来越依赖大数据手段来开展工作 2.为什么要学习大数据技术? 近年来,科学技术快速发展,数据分析有着很重要的地位。随着大数据在生活中的实际应用,学习大数据有着广阔的就业和发展前景。 3.简述大数据、云计 阅读全文
摘要:
阅读全文
摘要:
1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS,启动Hbase 8.进入shell界面 9.停止Hbase,停止HDFS运行 阅读全文
摘要:
1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。 1) 表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族 2) 行:每个HBase表都由若干行组成,每个行由行键(row key)来标识。 3) 列族:一个HBase表被分组成许多“列族”(Column Family 阅读全文
摘要:
一、在Ubuntu系统中安装和配置Eclipse 通过filezilla将eclipse包放进Hadoop里 解压eclipse包到所选目录 打开eclipse 二、利用hadoop 的java api,向HDFS写一个文件。 创建writefile类 启动HDFS 运行写文件 在HDFS查看运行结 阅读全文
摘要:
第四次作业 1.Hadoop是一个对海量数据存储和海量数据分析计算的分布式系统。 Hadoop是道格·卡丁(Doug Cutting)创建的,Hadoop起源于开源网络搜索引擎Apache Nutch,后者本身也是Lucene项目的一部分。Nutch项目面世后,面对数据量巨大的网页显示出了架构的灵活 阅读全文
摘要:
1)切换到目录 /usr/local (2)去到目前的上层目录 (3)回到自己的主文件夹 ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 mkdir命令:新建新目录 (5)进入/tmp目录,创建一个名为a的目录,并查看有多少目录存在 (6)创建目录a1/a2/a3/a4 rmdir命令 阅读全文