2021年12月25日
摘要: 02 1、安装Linux操作系统 2、安装关系型数据库MySQL 3、安装大数据处理框架Hadoop,查看IP 阅读全文
posted @ 2021-12-25 16:48 201906110029区景竣 阅读(14) 评论(0) 推荐(0) 编辑
  2021年12月13日
摘要: 09 一.安装Hive 下载解压重命名权限 配置环境变量 $HIVE_HOME 修改Hive配置文件 gedit 配置mysql驱动 下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls 在mysql新建hive数据库 show databases; 配置my 阅读全文
posted @ 2021-12-13 22:19 201906110029区景竣 阅读(17) 评论(0) 推荐(0) 编辑
  2021年11月29日
摘要: 阅读全文
posted @ 2021-11-29 19:38 201906110029区景竣 阅读(12) 评论(0) 推荐(0) 编辑
  2021年11月17日
摘要: 1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。 表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族行:每个HBase表都由若干行组成,每个行由行键来标识列族:一个HBase表被分组成许多列族的集合,它是基本的访问控制单元列限定符:列族里的数据通过列限定符,或列来定 阅读全文
posted @ 2021-11-17 01:00 201906110029区景竣 阅读(16) 评论(0) 推荐(0) 编辑
  2021年11月9日
摘要: 1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS,启动Hbase 8.进入shell界面 9.停止Hbase,停止HDFS运行 阅读全文
posted @ 2021-11-09 16:13 201906110029区景竣 阅读(3) 评论(0) 推荐(0) 编辑
  2021年11月3日
摘要: 一、在Ubuntu系统中安装和配置Eclipse 二、利用hadoop 的java api,向HDFS写一个文件。写入内容含自己的姓名 三、从HDFS读取一个文件的内容并显示。 阅读全文
posted @ 2021-11-03 23:53 201906110029区景竣 阅读(4) 评论(0) 推荐(0) 编辑
  2021年10月19日
摘要: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop起源于Apache Nutch项目,始于2002年,是Apache Lucene的子项目之一 。2004年,Google在“操作系统设计与实现”(Operating System Design and Implementa 阅读全文
posted @ 2021-10-19 17:16 201906110029区景竣 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 1.实验目的 为后续上机实验做准备,熟悉常用的Linux操作和Hadoop操作。 2.实验平台 操作系统:Linux Hadoop版本:2.7.1 3.实验内容和要求 (一)熟悉常用的Linux操作 请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local 阅读全文
posted @ 2021-10-19 12:59 201906110029区景竣 阅读(35) 评论(0) 推荐(0) 编辑
  2021年9月6日
摘要: 大数据到底是什么?我们为什么需要大数据技术?Mike Jude:从本质上来说,大数据就是曾经被称为数据仓库的逻辑延伸。顾名思义,大数据就是一个大型的数据仓库,一般有一个能支持业务决策的业务重点。但是,它和传统数据库不同的是,大数据不用构建。在典型的数据库中,数据会被组织成标准的字段,并使用特定的密钥 阅读全文
posted @ 2021-09-06 19:57 201906110029区景竣 阅读(15) 评论(0) 推荐(0) 编辑