03 2020 档案

数据立方建立-如何实现一对多,多对多
摘要:我对维度表,实体表,事实表这三种表之间的关系和概念认知比较模糊,当时老大要我去设计一个关于设备的维度和事实表及实体表出来时,结果我就真的去傻乎乎的对设备进行各种维度表和事实表的设计,然后在给老大看的时候各种被怼,最后才认知到设备怎么可能设计的出一个维度表呢,它本身就是一个客观存在的事实,我们是不可能 阅读全文

posted @ 2020-03-23 08:48 zaggu 阅读(423) 评论(0) 推荐(0)

从BI分析角度,数据立方的建立方法
摘要:本文不是从实例的角度,来分析如何构建一个数据立方体,而是从BI的产品角度出发,如何构建起一个更好的数据立方体系统。 概念部分 本部分以概念介绍为主,了解的同学请跳过。 数据立方体是一种多维数据模型,下面介绍一下多维模型的相关概念: • 多维数据模型:为了满足用户从多角度多层次进行数据查询和分析的需要 阅读全文

posted @ 2020-03-20 20:02 zaggu 阅读(774) 评论(0) 推荐(0)

数据分析与挖掘架构整体设计方案
摘要: 阅读全文

posted @ 2020-03-13 14:27 zaggu 阅读(266) 评论(0) 推荐(0)

MYSQL库内所有表名及表结构获取
摘要:MSSQL表名:SELECT-- 当前自增长字段最大值 --ident_current('TableName'),TableName= D.name ,Impdate=GETDATE() ,lasetDate=null,isrun=0,maxkey=0FROM sysobjects DWHERE D 阅读全文

posted @ 2020-03-06 09:10 zaggu 阅读(1006) 评论(0) 推荐(0)

数据归一化转化
摘要:一、特征二值化二、特征归一化(一)、总和标准化(二)、标准差标准化(三)、极大值标准化(四)、极差标准化(区间放缩法,0-1标准化)三、连续特征变换四、定性特征哑编码:One-hot编码数据变换数据变换即对数据进行规范化处理,以便于后续的信息挖掘。常见的数据变换包括:特征二值化、特征归一化、连续特征 阅读全文

posted @ 2020-03-06 09:06 zaggu 阅读(850) 评论(0) 推荐(0)

搭建数据仓库指引
摘要:技术架构:HADOOP架构数据采集:KETTLE,DATAX数据存储:HDFS、HIVE、MYSQL、POSTGRESQL(GREENPLUM)数据计算:SPARK数据通道:KAFKA任务调度: YARN多维数据:KYLIN数据同步:DATAX,KETTLE分布式协调:ZOOKEEEPER监控:代码 阅读全文

posted @ 2020-03-06 09:00 zaggu 阅读(616) 评论(0) 推荐(0)

价值链分析模型
摘要:价值链模型最早是由波特提出的。波特认为企业的竞争优势来源于企业在设计、生产、营销、交货等过程及辅助过程中所进行的许多相互分离的活动,设计任何产业内竞争的各种基本活动有五种类型:内部后勤:与接收、存储和分配相关联的各种活动,如原材料搬运、仓储、库存控制、车辆调度和向供应商退货。生产作业:与将投入转化为 阅读全文

posted @ 2020-03-05 16:47 zaggu 阅读(2001) 评论(0) 推荐(0)

16种常用数据分析方法
摘要:一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的 阅读全文

posted @ 2020-03-05 14:13 zaggu 阅读(3559) 评论(0) 推荐(0)

分析模型-SCP分析模型
摘要:SCP分析模型主要用于分析行业者企业受到外部冲击时,企业的战略调整及行为变化。SCP模型从特定行业结构、企业行为和经营绩效三个角度来分析外部冲击的影响。1、行业结构:主要是指外部各种环境的变化对企业所在行业可能的影响,包括行业竞争的变化、产品需求的变化、细分市场的变化、营销模型的变化等。2、企业行为 阅读全文

posted @ 2020-03-05 08:47 zaggu 阅读(2109) 评论(0) 推荐(0)

导航

返回顶部