2023年5月6日

K3cloud数据字典更新库表及字段注释(一)

摘要: 目标 由于K3CLOUD并未将表及字段注释填写在数据库表中,元数据采集过程中无法获取到注释信息,手工补充耗时耗力,打算通过爬取K3CLOUD数据字典的表及字段注释,然后批量填充到数据库。 一、获取K3CLOUD数据库表及字段数据 import PyClass.ConnMsSQL as msDB -- 阅读全文

posted @ 2023-05-06 13:34 zaggu 阅读(244) 评论(0) 推荐(0) 编辑

2021年2月19日

docsify 搭建优雅项目文档

摘要: 参考 https://docsify.js.org/#/zh-cn/more-pages 阅读全文

posted @ 2021-02-19 15:10 zaggu 阅读(44) 评论(0) 推荐(0) 编辑

2020年5月27日

SQLSERVER 系统表查询

摘要: 查询数据库select * From master.dbo.sysdatabases where name='数据库名' and status512--读取库中的所有表名 (当前数据库)select name from sysobjects where xtype='u' --读取指定表的所有列名 select name from syscolumns where id=(select max(i... 阅读全文

posted @ 2020-05-27 15:46 zaggu 阅读(843) 评论(0) 推荐(0) 编辑

2020年3月23日

数据立方建立-如何实现一对多,多对多

摘要: 我对维度表,实体表,事实表这三种表之间的关系和概念认知比较模糊,当时老大要我去设计一个关于设备的维度和事实表及实体表出来时,结果我就真的去傻乎乎的对设备进行各种维度表和事实表的设计,然后在给老大看的时候各种被怼,最后才认知到设备怎么可能设计的出一个维度表呢,它本身就是一个客观存在的事实,我们是不可能 阅读全文

posted @ 2020-03-23 08:48 zaggu 阅读(397) 评论(0) 推荐(0) 编辑

2020年3月20日

从BI分析角度,数据立方的建立方法

摘要: 本文不是从实例的角度,来分析如何构建一个数据立方体,而是从BI的产品角度出发,如何构建起一个更好的数据立方体系统。 概念部分 本部分以概念介绍为主,了解的同学请跳过。 数据立方体是一种多维数据模型,下面介绍一下多维模型的相关概念: • 多维数据模型:为了满足用户从多角度多层次进行数据查询和分析的需要 阅读全文

posted @ 2020-03-20 20:02 zaggu 阅读(648) 评论(0) 推荐(0) 编辑

2020年3月13日

数据分析与挖掘架构整体设计方案

摘要: 阅读全文

posted @ 2020-03-13 14:27 zaggu 阅读(235) 评论(0) 推荐(0) 编辑

2020年3月6日

MYSQL库内所有表名及表结构获取

摘要: MSSQL表名:SELECT-- 当前自增长字段最大值 --ident_current('TableName'),TableName= D.name ,Impdate=GETDATE() ,lasetDate=null,isrun=0,maxkey=0FROM sysobjects DWHERE D 阅读全文

posted @ 2020-03-06 09:10 zaggu 阅读(982) 评论(0) 推荐(0) 编辑

数据归一化转化

摘要: 一、特征二值化二、特征归一化(一)、总和标准化(二)、标准差标准化(三)、极大值标准化(四)、极差标准化(区间放缩法,0-1标准化)三、连续特征变换四、定性特征哑编码:One-hot编码数据变换数据变换即对数据进行规范化处理,以便于后续的信息挖掘。常见的数据变换包括:特征二值化、特征归一化、连续特征 阅读全文

posted @ 2020-03-06 09:06 zaggu 阅读(694) 评论(0) 推荐(0) 编辑

搭建数据仓库指引

摘要: 技术架构:HADOOP架构数据采集:KETTLE,DATAX数据存储:HDFS、HIVE、MYSQL、POSTGRESQL(GREENPLUM)数据计算:SPARK数据通道:KAFKA任务调度: YARN多维数据:KYLIN数据同步:DATAX,KETTLE分布式协调:ZOOKEEEPER监控:代码 阅读全文

posted @ 2020-03-06 09:00 zaggu 阅读(568) 评论(0) 推荐(0) 编辑

2020年3月5日

价值链分析模型

摘要: 价值链模型最早是由波特提出的。波特认为企业的竞争优势来源于企业在设计、生产、营销、交货等过程及辅助过程中所进行的许多相互分离的活动,设计任何产业内竞争的各种基本活动有五种类型:内部后勤:与接收、存储和分配相关联的各种活动,如原材料搬运、仓储、库存控制、车辆调度和向供应商退货。生产作业:与将投入转化为 阅读全文

posted @ 2020-03-05 16:47 zaggu 阅读(1896) 评论(0) 推荐(0) 编辑

导航

返回顶部