随笔分类 -  数据分析

摘要:数仓为什么要分层 合理的数据仓库分层一方面能够降低耦合性,提高重用性,可读性可维护性,另一方面也能提高运算的效率,影响到数据需求迭代的速度,近而影响到产品决策的及时性。建立数据分层可以提炼公共层,避免烟囱式开发,可见一个合适且合理的数仓分层是极其重要。 通用分层设计思路 ODS:操作型数据(Oper 阅读全文
posted @ 2022-07-07 14:31 Boblim 阅读(4557) 评论(0) 推荐(0)
摘要:正文 库操作 回到顶部 1、创建库 语法结构 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] //关于数据块的描述 [LOCATION hdfs_path] //指定数据库在HDFS上 阅读全文
posted @ 2020-01-20 11:12 Boblim 阅读(39631) 评论(0) 推荐(3)