2025/2/6
Hive是一个基于Hadoop的数据仓库工具,用于数据的提取、转换和加载(ETL)。它支持SQL-like语言(HiveQL),使得数据查询更加方便。
Hive架构:Hive的元数据存储和执行引擎。
Hive操作:创建表、插入数据、查询数据。
示例代码:
-- 创建表
CREATE TABLE employees (
id INT,
name STRING,
salary FLOAT
) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
-- 加载数据
LOAD DATA LOCAL INPATH '/path/to/local/file.csv' INTO TABLE employees;
-- 查询数据
SELECT * FROM employees;
运行步骤:
启动Hive服务:
hive
在Hive命令行中运行上述SQL语句。
观察查询结果。
Hive通过提供SQL-like语言,使得在Hadoop上进行数据查询和分析变得更加简单。它非常适合于处理大规模结构化数据