上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 52 下一页
摘要: 一、什么是数据模型 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。 数据仓库模型是数据模型中针对特 阅读全文
posted @ 2018-02-28 15:58 ---江北 阅读(1271) 评论(0) 推荐(0)
摘要: 一、简介 1.什么是数据仓库 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented )、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策和信息的全局共享。 //请熟练记忆 阅读全文
posted @ 2018-02-28 14:49 ---江北 阅读(1377) 评论(0) 推荐(0)
摘要: 推荐书籍:《网站分析实战——如何以数据驱动决策,提升网站价值》 相关随笔:http://blog.csdn.net/u014033218/article/details/76847263 一、网站点击流数据分析项目业务背景 1.什么是点击流数据 1.web访问日志 日志示例: 2.点击流数据模型 点 阅读全文
posted @ 2018-02-27 20:21 ---江北 阅读(5297) 评论(0) 推荐(1)
摘要: 一、概述 1.sqoop是什么 从其官网:http://sqoop.apache.org/ Apache Sqoop(TM) is a tool designed for efficiently transferring bulk data between Apache Hadoop and str 阅读全文
posted @ 2018-02-27 13:59 ---江北 阅读(504) 评论(0) 推荐(0)
摘要: 一、概述 很多时候,很多工具类其实spring中就已经提供,常用的工具类有: 参考:https://www.cnblogs.com/langtianya/p/3875103.html 内置的resouce类型 UrlResource ClassPathResource FileSystemResou 阅读全文
posted @ 2018-02-26 21:19 ---江北 阅读(2223) 评论(0) 推荐(0)
摘要: 一、概述 1.azkaban是什么 通过官方文档:https://azkaban.github.io/ Azkaban is a batch workflow job scheduler created at LinkedIn to run Hadoop jobs. Azkaban resolves 阅读全文
posted @ 2018-02-26 17:28 ---江北 阅读(1004) 评论(0) 推荐(0)
摘要: 一、概述 1.什么是flume 官网的介绍:http://flume.apache.org/ Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and mo 阅读全文
posted @ 2018-02-26 14:11 ---江北 阅读(439) 评论(0) 推荐(0)
摘要: 一、hive函数 1.内置运算符与内置函数 函数分类: 查看函数信息: 常用的分析函数之rank() row_number(),参考:https://www.cnblogs.com/wujin/p/6051768.html 常用20个内置函数: https://www.cnblogs.com/kim 阅读全文
posted @ 2018-02-25 15:32 ---江北 阅读(933) 评论(0) 推荐(0)
摘要: 一、基本操作 1.DDL 官网的DDL语法教程:点击查看 建表语句 data_type : primitive_type | array_type | map_type | struct_type | union_type -- (Note: Available in Hive 0.7.0 and 阅读全文
posted @ 2018-02-24 20:16 ---江北 阅读(3931) 评论(0) 推荐(0)
摘要: 一、基本概念 1.什么是hive The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage u 阅读全文
posted @ 2018-02-24 14:33 ---江北 阅读(1992) 评论(0) 推荐(0)
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 52 下一页
TOP