摘要: 阅读全文
posted @ 2021-12-17 16:26 MINFL 阅读(26) 评论(0) 推荐(0)
摘要: 一.安装Hive (1)下载解压重命名权限 (2)配置环境变量 $HIVE_HOME (3)修改Hive配置文件 gedit (4)配置mysql驱动 ①下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls②在mysql新建hive数据库 show datab 阅读全文
posted @ 2021-12-17 16:19 MINFL 阅读(59) 评论(0) 推荐(0)
摘要: WordCount程序任务: 程序 WordCount 输入 一个包含大量单词的文本文件 输出 文件中每个单词及其出现次数(频数), 并按照单词字母顺序排序, 每个单词和其频数占一行,单词和频数之间有间隔 1.用你最熟悉的编程环境,编写非分布式的词频统计程序。 读文件 分词(text.split列表 阅读全文
posted @ 2021-11-30 00:14 MINFL 阅读(41) 评论(0) 推荐(0)
摘要: 1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。 1) 表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族 2) 行:每个HBase表都由若干行组成,每个行由行键(row key)来标识。 3) 列族:一个HBase表被分组成许多“列族”(Column Family 阅读全文
posted @ 2021-11-07 23:41 MINFL 阅读(310) 评论(0) 推荐(0)
摘要: 1.下载压缩文件 将hbase下载到~目录下 2.解压 3.修改文件夹名 4.修改文件夹权限 (1)将权限分配给Hadoop用户 (2)查看Hbase版本 5.配置环境变量 (1)将hbase下的bin目录添加到path中,这样,启动hbase就无需到/usr/local/hbase目录下,大大的方 阅读全文
posted @ 2021-11-02 17:55 MINFL 阅读(115) 评论(0) 推荐(0)
摘要: (Hadoop生态圈) 1.用图文简要描述Hadoop起源与发展阶段。 Hadoop起源于Apache Nutch项目,始于2002年,是Apache Lucene的子项目之一。2004年,Google在“操作系统设计与实现”(Operating System Design and Implemen 阅读全文
posted @ 2021-10-29 17:48 MINFL 阅读(239) 评论(0) 推荐(0)
摘要: 一、在Ubuntu系统中安装和配置Eclipse 通过filezilla将eclipse包放进Hadoop里 解压eclipse包到所选目录 打开eclipse 二、利用hadoop 的java api,向HDFS写一个文件。 创建writefile类 启动HDFS 运行写文件 在HDFS查看运行结 阅读全文
posted @ 2021-10-29 17:33 MINFL 阅读(30) 评论(0) 推荐(0)
摘要: (一)熟悉常用的Linux操作 cd命令:切换目录(1)切换到目录 /usr/local cd /usr cd /local(2)去到目前的上层目录 cd ..(3)回到自己的主文件夹 cd ~ ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 cd /usr ls -al ~ mkdi 阅读全文
posted @ 2021-09-22 21:53 MINFL 阅读(198) 评论(0) 推荐(0)
摘要: 1.为什么产生大数据技术? 现代生活中,无时无刻不在不断产生数据,一些零散的,各种类型的数据,如果不能在短时间内分析出来信息所表达的含义,那么可以利用大数据分析技术,将信息中潜藏的价值挖掘出来,以便于工作研究或者其他用途的使用,便于政务的便捷化和深层次化。 2.为什么要学习大数据技术? 数据的价值在 阅读全文
posted @ 2021-09-10 21:56 MINFL 阅读(182) 评论(0) 推荐(1)