摘要: 一、edits 文件 一)文件组成 一个edits文件记录了一次写文件的过程,该过程被分解成多个部分进行记录;(每条记录在hdfs中有一个编号) 每一个部分为: '<RECORD>...</RECORD>' ; 每一部分包含了:'<OPCODE> ... </OPCODE>' 和 '<DATA> . 阅读全文
posted @ 2020-10-22 14:24 何永灿 阅读(760) 评论(0) 推荐(0) 编辑
摘要: 参考:RPM简介与基本使用 博主:大师兄的博客 目录 一、什么是RPM 二、RPM的优点和缺点 1. 优点 2. 缺点 三、RPM的使用权限 四、RPM包的命名规则 1. 命名格式 2. 说明 3. 范例 4. 特殊名称 五、基本用法 一)RPM的软件包查询功能 二)软件包的安装和升级 三)RPM卸 阅读全文
posted @ 2020-10-15 21:07 何永灿 阅读(299) 评论(0) 推荐(0) 编辑
摘要: 参考:SQL中where与having的区别 博主:永恒的留忆 一、where和having的区别 where: where 是一个约束声明,使用 where 来约束来自数据库的数据; where 是在结果返回之前起作用的; where 中不能使用聚合函数; having: having 是一个过滤 阅读全文
posted @ 2020-10-04 10:18 何永灿 阅读(489) 评论(0) 推荐(0) 编辑
摘要: 参考 1:Microsoft 中的 SQL Server 文档(分析函数、排名行数、聚合函数、OVER窗口函数) 参考 2:SQL Server 分析函数和排名函数 博主:悦光阴 分析函数基于分组,计算分组内数据的聚合值,经常会和窗口函数OVER()一起使用,使用分析函数可以很方便地计算同比和环比, 阅读全文
posted @ 2020-10-03 12:38 何永灿 阅读(4148) 评论(0) 推荐(0) 编辑
摘要: 参考:MySQL中各SQL子句的逻辑执行顺序 前言 本文节选自《MySQL技术内幕:SQL编程》3.1 逻辑查询处理 本文说明的执行顺序只是一种逻辑顺序,并不是MySQL中SQL查询语句的实际执行过程。MySQL在实际执行SQL语句时,由于MySQL Optimizer优化器的存在,会将SQL子句的 阅读全文
posted @ 2020-09-28 21:46 何永灿 阅读(474) 评论(0) 推荐(0) 编辑
摘要: 一、CASE 表达式概述 逻辑:如果满足 WHEN 后的条件,返回 THEN 后的内容; WHEN 后的条件:可以使用 BETWEEN、LIKE、<、>、= 等谓词组合,也可以嵌套子查询的 IN 和 EXISTS 谓词; 1、两种写法:简单 CASE 表达式、搜索 CASE 表达式 -- 简单 CA 阅读全文
posted @ 2020-09-28 16:17 何永灿 阅读(558) 评论(0) 推荐(0) 编辑
摘要: 参考: MySQL中TEXT与BLOB类型的区别 主要差别 TEXT与BLOB的主要差别就是 BLOB 保存二进制数据 TEXT 保存字符数据 目前几乎所有博客内容里的图片都不是以二进制存储在数据库的,而是把图片上传到服务器然后正文里使用<img>标签引用,这样的博客就可以使用TEXT类型。而BLO 阅读全文
posted @ 2020-09-16 11:53 何永灿 阅读(1700) 评论(0) 推荐(0) 编辑
摘要: 参考:MySQL中varchar与char区别 博主:叫我大头 一、char 和 varchar 区别 1、定长和变成 char:定长,长度固定;varchar:变长,长度可变; 当插入的字符串长度小于定义长度时,则会以不同的方式来处理,如char(10),表示存储的是10个字符,无论你插入的是多少 阅读全文
posted @ 2020-09-16 10:57 何永灿 阅读(1104) 评论(0) 推荐(0) 编辑
摘要: 一、数据质量保障原则 如何评估数据质量的好坏,业界有不同的标准,阿里主要从 4 个方面进行评估:完整性、准确性、一致性、及时性; 1、完整性2 数据完整性是数据最基础的保障; 完整性:指数据的记录和信息是否完整,是否存在缺失的情况; 数据缺失:主要包括记录的缺失和记录中某个字段信息的缺失; 记录的丢 阅读全文
posted @ 2020-09-14 10:49 何永灿 阅读(6305) 评论(3) 推荐(0) 编辑
摘要: 数据存储和成本管理: 有效的降低存储资源的消耗,节省存储成本,是存储管理孜孜追求的目标; 一般从 4 个方面优化存储:数据压缩、数据重分布、存储治理项优化、生命周期管理; 一、数据压缩 实际中的数据存储情况:在其它分布式计算系统中,为了提高数据的可用性和性能,通常会将数据存储 3 份;这就意味着存储 阅读全文
posted @ 2020-09-13 09:56 何永灿 阅读(1787) 评论(0) 推荐(0) 编辑