YuNi、

2021年12月18日

摘要： 1.理解HBase表模型及四维坐标：行键、列族、列限定符和时间戳。 HBase 是一个稀疏、多维度、有序的映射表。这张表中每个单元是通过由行键、列族、列限定符和时间戳组成的索引来标识的。行键是行的唯一标识，行键并没有什么特定的数据类型，以二进制的字节来存储，按字母顺序排序。在定义 HBase 阅读全文

posted @ 2021-12-18 19:51 YuNi、阅读(32) 评论(0) 推荐(0)

2021年12月17日

补交

摘要：第六次作业 https://www.cnblogs.com/xxx118/p/15560812.html 第七次作业 https://www.cnblogs.com/h1595047650/p/15545892.html 阅读全文

posted @ 2021-12-17 15:09 YuNi、阅读(24) 评论(0) 推荐(0)

2021年12月14日

第九次作业

摘要：一.安装Hive 下载解压重命名权限配置环境变量 $HIVE_HOME 修改Hive配置文件 gedit 配置mysql驱动下载合适版本的mysql jar包，拷贝到/usr/local/hive/lib目录下 ls 在mysql新建hive数据库 show databases; 配置mysql 阅读全文

posted @ 2021-12-14 14:08 YuNi、阅读(10) 评论(0) 推荐(0)

2021年11月23日

第八次作业

摘要： WordCount程序任务：程序 WordCount 输入一个包含大量单词的文本文件输出文件中每个单词及其出现次数（频数），并按照单词字母顺序排序，每个单词和其频数占一行，单词和频数之间有间隔 1.用你最熟悉的编程环境，编写非分布式的词频统计程序。读文件分词（text.split列表阅读全文

posted @ 2021-11-23 14:53 YuNi、阅读(46) 评论(0) 推荐(0)

2021年11月16日

第六次作业

摘要： 1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限（1）分配权限给hadoop用户（2）查看Hbase版本 5.配置环境变量（1）打开bashrc配置文件（2）将hbase下的bin目录添加到path中（3）启动配置文件（4）在任何目录下查看Hbase版本 6.伪分布式配置阅读全文

posted @ 2021-11-16 13:32 YuNi、阅读(27) 评论(0) 推荐(0)

2021年11月2日

第五次作业

摘要：一、在Ubuntu系统中安装和配置Eclipse 1. 2. 3. 4. 二、利用hadoop 的java api，向HDFS写一个文件。 1. 2. 3. 4. 5. 三、从HDFS读取一个文件的内容。 1. 2. 3. 阅读全文

posted @ 2021-11-02 16:45 YuNi、阅读(13) 评论(0) 推荐(0)

2021年10月29日

第四次作业

摘要： 1.用图与自己的话，简要描述Hadoop起源与发展阶段。 Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载方面上的天然优势。Hadoop的分布式架构，将大数据处理引擎尽可能的靠近存储，对例如像ETL这样的批处理操作相对合适，因为类似这样操作的批处理结果可以直接走向存储。H 阅读全文

posted @ 2021-10-29 14:13 YuNi、阅读(52) 评论(0) 推荐(0)

2021年9月27日

第三次作业

摘要： cd命令：切换目录（1）切换到目录 /usr/local （2）去到目前的上层目录（3）回到自己的主文件夹 ls命令：查看文件与目录（4）查看目录/usr下所有的文件 mkdir命令：新建新目录（5）进入/tmp目录，创建一个名为a的目录,并查看有多少目录存在（6）创建目录a1/a2/a3 阅读全文

posted @ 2021-09-27 21:20 YuNi、阅读(77) 评论(0) 推荐(0)

2021年9月9日

大数据第一次作业

摘要：一、为什么会产生大数据？ “大数据是信息化发展的新阶段”，并做出了“推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全”的战略部署，为我国构筑大数据时代国家综合竞争新优势指明了方向！二、为什么要学习大数据阅读全文

posted @ 2021-09-09 19:07 YuNi、阅读(67) 评论(0) 推荐(0)

公告