2022 年 9月随笔档案 - 不想写代码的小玉

Phoenix使用及搭建 bulkLoad实现批量导入

摘要：Phoenix Phoenix和hbase共用一个zookeeper，但是在刚建好Phoenix的时候是读不到hbase中的表的，在Phoenix中建过表之后在hbase中可以看到，在hbase中建过表Phoenix中看不到 Hbase适合存储大量的对关系运算要求低的NOSQL数据，受Hbase 设阅读全文

posted @ 2022-09-21 20:51 不想写代码的小玉阅读(562) 评论(0) 推荐(0)

HBase读写流程，分裂策略，Compaction操作，可快速查询百亿数据原因，hbase和hive的集成

摘要：HBase的读写流程架构图 1）、HBase读流程 Hbase读取数据的流程： 1）是由客户端发起读取数据的请求，首先会与zookeeper建立连接 2）从zookeeper中获取一个hbase:meta表位置信息，被哪一个regionserver所管理着 hbase:meta表：hbase的元数阅读全文

posted @ 2022-09-21 17:03 不想写代码的小玉阅读(173) 评论(0) 推荐(0)

HBase在idea中（JAVA API）、过滤器

摘要：JAVA API pom文件 <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> <dependency> <groupId>org.ap 阅读全文

posted @ 2022-09-19 21:19 不想写代码的小玉阅读(201) 评论(0) 推荐(0)

HBase-day1-day2内容理解

摘要：HBase图 HBase概述 HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，用于存储海量的结构化或者半结构化，非结构化的数据（底层是字节数组做存储的） HBase是Hadoop的生态系统之一，是建立在Hadoop文件系统（HDFS）之上的分布式、面向列的数据库，通过利用Hado 阅读全文

posted @ 2022-09-15 19:24 不想写代码的小玉阅读(98) 评论(0) 推荐(0)

HBase搭建及命令

摘要：HBase搭建 1、hbase下载官网下载地址：https://www.apache.org/dyn/closer.lua/hbase/1.4.6/hbase-1.4.6-bin.tar.gz 2 前期准备（Hadoop,zookeeper,jdk）启动hadoop start-all.sh 验阅读全文

posted @ 2022-09-12 19:53 不想写代码的小玉阅读(99) 评论(0) 推荐(0)

Hive优化-重要

摘要：Hiv优化 1.hive的随机抓取策略理论上来说，Hive中的所有sql都需要进行mapreduce，但是hive的抓取策略帮我们省略掉了这个过程，把切片split的过程提前帮我们做了。 set hive.fetch.task.conversion=none; (一旦进行这么设置，select字阅读全文

posted @ 2022-09-08 20:47 不想写代码的小玉阅读(103) 评论(0) 推荐(0)

Hive-day4

摘要：HiveSQL书写 1.count(*)、count(1)、count('字段名') 区别从执行结果来看 count(*)包括了所有的列，相当于行数，在统计结果的时候，不会忽略列值为NULL 最慢的 count(1)包括了忽略所有列，用1代表代码行，在统计结果的时候，不会忽略列值为NULL 最快的阅读全文

posted @ 2022-09-08 17:44 不想写代码的小玉阅读(49) 评论(0) 推荐(0)

Hive-day3

摘要：Hive分区在大数据中，最常见的一种思想就是分治，我们可以把大的文件切割划分成一个个的小的文件，这样每次操作一个个小的文件就会很容易了，同样的道理，在hive当中也是支持这种思想的，就是我们可以把大的数据，按照每天或者每小时切分成一个个小的文件，这样去操作小的文件就会容易很多了。假如现在我们公司阅读全文

posted @ 2022-09-06 19:54 不想写代码的小玉阅读(29) 评论(0) 推荐(0)

Hive-day2

摘要：Hive的基本操作 Hive库操作 1.创建数据库 1）创建一个数据库，数据库在**HDFS上的默认存储路径是/hive/warehouse/\*.db**。 create database testdb; 2）避免要创建的数据库已经存在错误，增加if not exists判断。（标准写法） cre 阅读全文

posted @ 2022-09-05 16:30 不想写代码的小玉阅读(90) 评论(0) 推荐(0)

hive配置和安装-day2

摘要：Hive1.2.1安装 1.上传压缩包并解压（在/usr/local/soft/目录下） tar -zxvf apache-hive-1.2.1-bin.tar.gz 2.修改目录名称 mv apache-hive-1.2.1-bin hive-1.2.1 3.修改配置文件（在hive-1.2.1下阅读全文

posted @ 2022-09-02 11:21 不想写代码的小玉阅读(53) 评论(0) 推荐(0)

Hive day1内容理解

摘要：Hive（数据仓库建模工具之一）简介： Hive本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据存储，说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具，甚至更近一步说hive就是一个MapReduce客户端。思考：计算文件user.txt中张阅读全文

posted @ 2022-09-01 23:29 不想写代码的小玉阅读(80) 评论(0) 推荐(0)

wqy1027

09 2022 档案