上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 41 下一页
摘要: 聚集型事实表概念 数据仓库的性能是数据仓库建设是否成功的重要标准之一。 聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。通过访问聚集数据,可以减少数据库在响应查询时必须执行的工作量,能够快速响应用户的查询,同时有利于减少不同用户访问明细数据带来的结果不一致问题。尽管聚集能带来良好的收益,但需 阅读全文
posted @ 2021-06-15 10:21 Binge-和时间做朋友 阅读(1109) 评论(0) 推荐(0)
摘要: 累计快照事实表的概念 累积快照事实表用来表述过程开始和结束之间的关键步骤事件,覆盖过程的整个生命周期,通常具有多个日期字段来记录关键时间点, 当过程随着生命周期不断变化时,记录也会随着过程的变化而被修改。 设计过程 对于累积快照事实表,其建模过程和事务事实表相同,适用于维度建模的步骤。 下面详述淘宝 阅读全文
posted @ 2021-06-15 10:19 Binge-和时间做朋友 阅读(2645) 评论(2) 推荐(0)
摘要: 周期快照事实表概念 周期快照事实表以具有规律性的、可预见的时间间隔记录事实,时间间隔如每天、每月、每年等,简称“快照事实表” 快照事实表特性 用快照采样状态 快照事实表以预定的间隔采样状态度量。这种间隔联合一个或多个维度,将被用来定义快照事实表的粒度,每行都将包含记录所涉及状态 的事实。 现在以淘宝 阅读全文
posted @ 2021-06-15 10:18 Binge-和时间做朋友 阅读(2997) 评论(0) 推荐(0)
摘要: 事务事实表概念 事务事实表用来描述业务过程,跟踪空间或时间上某点的度量事件,保存的是最原子的数据,也称为“原子事实表“ 设计过程 任何类型的事件都可以被理解为一种事务。比如交易过程中的创建订单、买家付款,物流过程中的揽货、发货、签收,退款中的申请退款、申请小二介入等,都可以被理解为一种事务。 事务事 阅读全文
posted @ 2021-06-15 10:17 Binge-和时间做朋友 阅读(1376) 评论(0) 推荐(0)
摘要: 事实表设计 什么是事实表 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度 和与业务过程有关的度量。 事实表中一条记录所表达的业务细节程度被称为粒度。 通常粒度可以通过两种方式来表述: 一种是维度属性组合所表示的细节程度 一种是所 阅读全文
posted @ 2021-06-15 10:15 Binge-和时间做朋友 阅读(801) 评论(0) 推荐(0)
摘要: 什么是维度 维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实” ,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。 例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。 什么是维度属性 **维度所包含的表示维度的列,称为维度属性。**维度属性是查询约束 阅读全文
posted @ 2021-06-11 11:19 Binge-和时间做朋友 阅读(997) 评论(0) 推荐(0)
摘要: 1. 检查当前系统是否安装过mysql [root@yum ~]# rpm -qa|grep mariadb mariadb-libs-5.5.68-1.el7.x86_64 #已经存在 # 存在则先卸载 [root@yum ~]# rpm -e --nodeps mariadb-libs 2. 检 阅读全文
posted @ 2021-06-06 22:47 Binge-和时间做朋友 阅读(980) 评论(0) 推荐(1)
摘要: 环境准备 CentOS:7.0 JDK:1.8 Flink 集群:node-01(Master)、node-02(Slave)、node-03(Slave) 安装与配置 SFTP 上传 Flink 安装包并解压 [root@node-01 ~]# tar -zxvf flink-1.9.0-bin- 阅读全文
posted @ 2021-05-31 21:49 Binge-和时间做朋友 阅读(311) 评论(0) 推荐(0)
摘要: 引言 spark 在读取 csv 文件时,可能会涉及到很多参数设置,这篇文章总结了 option 里面的参数,希望能够对你有所帮助 option 参数详解 参数 解释 sep 默认是, 指定单个字符分割字段和值 encoding 默认是uft-8通过给定的编码类型进行解码 quote 默认是“,其中 阅读全文
posted @ 2021-05-31 17:12 Binge-和时间做朋友 阅读(3324) 评论(0) 推荐(0)
摘要: 安装准备 Spark 集群和 Hadoop 类似,也是采用主从架构,Spark 中的主服务器进程就叫 Master(standalone 模式),从服务器进程叫 Worker Spark 集群规划如下: node-01:Master node-02:Worker node-03:Worker 安装步 阅读全文
posted @ 2021-05-20 08:51 Binge-和时间做朋友 阅读(273) 评论(0) 推荐(1)
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 41 下一页