阿拉布斯加 - 博客园

2021年12月14日

摘要：一.安装Hive 下载解压重命名权限（1）解压安装（2）重命名权限 2.配置环境变量 3.修改Hive配置文件 4.配置mysql驱动 1.下载合适版本的mysql jar包，拷贝到/usr/local/hive/lib目录下 2.在mysql新建hive数据库 3.配置mysql允许hive接阅读全文

posted @ 2021-12-14 14:32 阿拉布斯加阅读(31) 评论(0) 推荐(0)

2021年11月23日

08 分布式计算MapReduce--词频统计

摘要： WordCount程序任务：程序 WordCount 输入一个包含大量单词的文本文件输出文件中每个单词及其出现次数（频数），并按照单词字母顺序排序，每个单词和其频数占一行，单词和频数之间有间隔 1.用你最熟悉的编程环境，编写非分布式的词频统计程序。读文件分词（text.split列表阅读全文

posted @ 2021-11-23 15:30 阿拉布斯加阅读(60) 评论(0) 推荐(0)

2021年11月5日

07 HBase操作

摘要： 1.理解HBase表模型及四维坐标：行键、列族、列限定符和时间戳。表的每一行由一个或多个列族组成，一个列族中可以包含任意多个列。在同一个表模式下，每行所包含的列族是相同的，也就是说，列族的个数与名称都是相同的，但是每一行中的每个列族中列的个数可以不同，如图 1 所示。 (1)表（Table):HB 阅读全文

posted @ 2021-11-05 15:29 阿拉布斯加阅读(173) 评论(0) 推荐(0)

2021年11月2日

06 HBase安装与伪分布式配置

摘要： 1.下载压缩2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS，启动Hbase 8.进入shell界面 9.停止Hbase，停止HDFS运行阅读全文

posted @ 2021-11-02 17:25 阿拉布斯加阅读(25) 评论(0) 推荐(0)

2021年10月29日

05 HDFS Java API应用实例

摘要：一、在Ubuntu系统中安装和配置Eclipse 启动、配置eclipse 为工程添加需要用到的JAR包二、利用hadoop 的java api，向HDFS写一个文件。启动HDFS 查看HDFS用户主目录下的文件（为后续作对比）编写文件并运行 HDFS上查看，多了文件dingdang.txt 阅读全文

posted @ 2021-10-29 16:42 阿拉布斯加阅读(48) 评论(0) 推荐(0)

2021年10月22日

04 Hadoop思想与原理，HBase架构与原理，MapReduce架构与工作过程

摘要： 1.用图与自己的话，简要描述Hadoop起源与发展阶段。最早Doug Cutting（后面被称为hadoop之父）领导创立了Apache的项目Lucene，然后Lucene又衍生出子项目Nutch，Nutch又衍生了子项目Hadoop。Lucene是一个功能全面的文本搜索和查询库，Nutch目标就阅读全文

posted @ 2021-10-22 14:41 阿拉布斯加阅读(177) 评论(0) 推荐(0)

2021年10月8日

02 环境搭建

摘要：阅读全文

posted @ 2021-10-08 17:27 阿拉布斯加阅读(42) 评论(0) 推荐(0)

2021年9月27日

03Linux与Hadoop操作实验

摘要：《大数据应用技术》实验1 第二章熟悉常用的Linux操作和Hadoop操作 1.实验目的为后续上机实验做准备，熟悉常用的Linux操作和Hadoop操作。 2.实验平台操作系统：Linux 3.实验内容和要求（一）熟悉常用的Linux操作请按要求上机实践如下linux基本命令。 cd命令：阅读全文

posted @ 2021-09-27 21:37 阿拉布斯加阅读(134) 评论(0) 推荐(0)

2021年9月10日

01大数据概述

摘要： 1.为什么产生大数据技术？大数据是网络信息时代的客观存在，其产生的意义在于对这些数据进行专业存储和处理，并从中挖掘和提取所需要的知识和信息。技术突破来源于实际的产品需求，如果将大数据比作一种产业，那么降低存储成本，提升运行速度和计算速度，以及对数据进行多维度的分析加工，实现并提升数据的价值，这是大阅读全文

posted @ 2021-09-10 15:26 阿拉布斯加阅读(132) 评论(0) 推荐(0)

公告