摘要: 检查当前系统是否安装过mysql [root@master ~]# rpm -qa|grep mariadb mariadb-libs-5.5.68-1.el7.x86_64 #已经存在 存在则先卸载 [root@master ~]# rpm -e --nodeps mariadb-libs 2. 阅读全文
posted @ 2023-02-24 16:18 追こするれい的人 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 一、count情况 1、count(1):可以统计表中所有数据,不统计所有的列,用1代表代码行,在统计结果中包含列字段为null的数据; 2、count(字段):只包含列名的列,统计表中出现该字段的次数,并且不统计字段为null的情况; 3、count(*):统计所有的列,相当于行数,统计结果中会包 阅读全文
posted @ 2022-04-07 20:30 追こするれい的人 阅读(2680) 评论(0) 推荐(0) 编辑
摘要: schedule_interval=None 不需要托管作业,仅手动触发 schedule_interval=0 * * * * 表示每小时运行一次 schedule_interval=30 0 * * * 表示每天在零点30分运行一次 schedule_interval=30 0 * * 0 表示 阅读全文
posted @ 2022-04-06 20:54 追こするれい的人 阅读(1321) 评论(0) 推荐(0) 编辑
摘要: 大数据 什么是 ETL ETL 概念 ETL 这个术语来源于数据仓库,ETL 指的是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程。ETL 的目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是 BI 项目重要的一个环节。 通常情况下,在 BI 项 阅读全文
posted @ 2022-02-14 17:02 追こするれい的人 阅读(362) 评论(0) 推荐(0) 编辑
摘要: MySQL 查询操作 目录 基本语法 查询常量 查看表达式 查询函数 查询指定字段 查询所有列 列别名 表别名 条件查询 条件查询运算符 逻辑查询运算符 排序与分页 排序查询(order by) 排序方式 limit 分组查询 分组中 select 后⾯只能有两种类型的列 聚合函数 单字段分组 多字 阅读全文
posted @ 2022-02-14 16:56 追こするれい的人 阅读(59) 评论(0) 推荐(0) 编辑
摘要: Flume Source 详解 Source 类型 Flume 支持从不同的 Source(数据源)采集数据,如下: 数据源描述 Avro Source 通过监听一个网络端口来接受数据,而且接受的数据必须是使用avro序列化框架序列化后的数据; Thrift Source 监听Thrift端口并从外 阅读全文
posted @ 2022-01-28 23:55 追こするれい的人 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 核心概念 Agent Flume 最核心的角色就是 Agent。Flume 数据采集系统是由一个个 Agent 连接起来的数据传输通道 对于每个 Agent来 说就是一个独立的守护进程(JVM),它负责从数据源接收数据,并发送到下一个目的地 Agent 内部有三个重要的组件:Source,Chann 阅读全文
posted @ 2022-01-28 21:43 追こするれい的人 阅读(78) 评论(0) 推荐(0) 编辑
摘要: Flume 是什么 Flume 是一个开源的分布式数据收集框架,可以提供一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统 当前 Flume 有两个版本 Flume 0.9X 版本的统称 Flume-og,Flume1.X 版本的统称 Flume-ng。由于 Flume-ng 经过重大重 阅读全文
posted @ 2022-01-28 20:47 追こするれい的人 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 为什么需要二级索引 HBase 一个令人惋惜的地方,就是不支持二级索引。因此,在实际项目开发中有一些补充方案来填补 HBase 的二级索引能力的缺陷。 HBase 系统单纯从解决大数据实时读写问题角度出发,重点关注于分布式存储的扩展性、容错性、读写性能等方面,为此也牺牲了很多传统关系型数据库的功能, 阅读全文
posted @ 2022-01-28 20:42 追こするれい的人 阅读(203) 评论(0) 推荐(0) 编辑
摘要: HBase Region 拆分与合并 Region 拆分 Region 自动拆分 HBase Region 的自动拆分有 6 种触发策略,如下: ConstantSizeRegionSplitPolicy :按照固定大小来拆分 Region 策略 IncreasingToUpperBoundRegi 阅读全文
posted @ 2022-01-28 20:28 追こするれい的人 阅读(336) 评论(0) 推荐(0) 编辑