随笔分类 -  数据仓库

摘要:以前一直对维度表, 事实表, 数据分析, BI等概念等有一些模糊. 这几天的学习终于让这些有了一些眉目了: 维度表示你要对数据进行分析时所用的一个量, 比如你要分析产品销售情况, 你可以选择按类别来进行分析,或按区域来分析. 这样的按..分析就构成一个维度。前面的示例就可以有两个维度:类型和区域。另 阅读全文
posted @ 2017-02-18 23:34 田园沃土 阅读(2238) 评论(0) 推荐(0)
摘要:这两天一直在思考一个问题,为什么要用专业的etl工具进行数据清洗,原因如下: ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。 如果数据转换的频率或者要求不高可以手动实现ETL的 阅读全文
posted @ 2017-01-09 10:10 田园沃土 阅读(458) 评论(0) 推荐(0)