第七周学习总结
数据仓库基础与Apache Hive入门
数据仓库基本概念:
一个用于存储、分析、报告的数据系统
目的:构建面向分析的集成化数据环境,分析结果为企业提供决策支持
主要特征:
面向主题
集成性
非易失性
时变性
SQL 结构化查询语言
存储数据以及查询更新和管理数据
结构化数据:行数据,由二维表结构来逻辑表达和实现的数据
DDL数据定义语言 DML数据操纵语言
Hive:建立在Hadoop上的开源的数据仓库系统,将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表
Hive查询语句(HQL)
Hive利用HDFS存储数据,利用MapReduce查询分析数据
映射信息记录,元数据信息
Hive架构组件
用户接口
Hive Metadata元数据
Hive Metastore元数据服务

datagrip连接数据库
数据库与建库、切换库操作



表与建表语句,数据类型、分隔符指定语法



浙公网安备 33010602011771号