随笔分类 -  大数据

摘要:转载https://www.cnblogs.com/frankdeng/p/9462754.html 一 数据仓库的概念 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性 阅读全文
posted @ 2019-12-16 18:59 程序猿-小秦 阅读(413) 评论(0) 推荐(0)
摘要:ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。 ETL的 阅读全文
posted @ 2019-07-25 19:01 程序猿-小秦 阅读(227) 评论(0) 推荐(0)
摘要:转自:http://blog.csdn.net/lifuxiangcaohui/article/details/40588929 Hive数据导入——数据存储在Hadoop分布式文件系统中,往Hive表里面导入数据只是简单的将数据移动到表所在的目录中! 转自:http://blog.csdn.net 阅读全文
posted @ 2017-09-20 12:45 程序猿-小秦 阅读(508) 评论(0) 推荐(0)
摘要:hadoop集群默认配置和常用配置 http://www.cnblogs.com/ggjucheng/archive/2012/04/17/2454590.html 获取默认配置 配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配 阅读全文
posted @ 2017-08-09 17:07 程序猿-小秦 阅读(455) 评论(0) 推荐(0)