2025 年 2月 13 日随笔档案 - 伐木工熊大

2025年2月13日

2025/2/13

摘要：我们使用Python爬取了数据并存储到HDFS中。本篇博客将介绍如何使用Hadoop和Spark对这些数据进行分析。Hive数据加载：将HDFS中的数据加载到Hive表中。Spark数据分析：使用Spark进行数据清洗和分析。示例代码：Hive加载数据：-- 创建Hive表CREATE TABLE 阅读全文

posted @ 2025-02-13 22:38 伐木工熊大阅读(23) 评论(0) 推荐(0)

zhenaifen

公告