摘要: 一.安装Hive 下载解压重命名权限 配置环境变量 $HIVE_HOME 修改Hive配置文件 gedit 配置mysql驱动 (1)下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls (2)在mysql新建hive数据库 show databases; ( 阅读全文
posted @ 2021-12-10 15:28 种花家的流氓兔 阅读(63) 评论(0) 推荐(0) 编辑
摘要: WordCount程序任务: 程序 WordCount 输入 一个包含大量单词的文本文件 输出 文件中每个单词及其出现次数(频数), 并按照单词字母顺序排序, 每个单词和其频数占一行,单词和频数之间有间隔 1.用你最熟悉的编程环境,编写非分布式的词频统计程序。 读文件 分词(text.split列表 阅读全文
posted @ 2021-11-23 15:29 种花家的流氓兔 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 1.理解HBase表模型及四维坐标:行键、列族、列限定符和时间戳。 2.启动HDFS,启动HBase,进入HBaseShell命令行。 3.列出HBase中所有的表信息list 4.创建表create 5.查看表详情desc 6.插入数据put 7.查看表数据scan 例子:尝试分别用MySQL和H 阅读全文
posted @ 2021-11-05 15:30 种花家的流氓兔 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 06 HBase安装与伪分布式配置 1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 (1)分配权限给hadoop用户 (2)查看Hbase版本 5.配置环境变量 (1)打开bashrc配置文件 (2)将hbase下的bin目录添加到path中 (3)启动配置文件 (4)在任何目录下 阅读全文
posted @ 2021-11-02 16:48 种花家的流氓兔 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 05 HDFS Java API应用实例 一、在Ubuntu系统中安装和配置Eclipse 1、通过FileZilla传输到linux目录下 2、解压 eclipse-4.7.0-linux.gtk.x86_64.tar.gz文件 3、进入 /usr/local/eclipse目录,打开eclips 阅读全文
posted @ 2021-10-29 16:30 种花家的流氓兔 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 1.用图与自己的话,简要描述Hadoop起源与发展阶段。 (1)、Hadoop是什么?Hadoop是一个对海量数据存储和海量数据分析计算的分布式系统。 0.x系列版本:Hadoop当中最早的一个开源版本,在此基础上演变而来的1.x以及2.x的版本1.x版本系列:Hadoop版本当中的第二代开源版本, 阅读全文
posted @ 2021-10-25 22:29 种花家的流氓兔 阅读(82) 评论(0) 推荐(0) 编辑
摘要: (一)熟悉常用的Linux操作 请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local cd /usr/local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd~ ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 cd 阅读全文
posted @ 2021-09-24 17:49 种花家的流氓兔 阅读(109) 评论(0) 推荐(0) 编辑
摘要: (一)熟悉常用的Linux操作 请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local (2)去到目前的上层目录 (3)回到自己的主文件夹 ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 cd/ cd/usr ls -al mkdir命令: 阅读全文
posted @ 2021-09-22 21:22 种花家的流氓兔 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-09-21 22:14 种花家的流氓兔 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 1、为什么产生大数据技术? 答:为什么产生了大数据技术,因为对人类生活发展具有重大价值 大数据的价值体现在以下几个方面:1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销2) 做小而美模式的中小微企业可以利用大数据做服务转型3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大 阅读全文
posted @ 2021-09-14 15:05 种花家的流氓兔 阅读(296) 评论(0) 推荐(0) 编辑