摘要:
第15天:Spark项目实战2 学习目标:使用Spark Streaming进行实时数据处理。 具体内容: 项目:网站点击流实时分析。 模拟生成点击流数据(使用Socket或Kafka)。 使用Spark Structured Streaming实时统计点击量、独立访客数(UV)。 将实时统计结果输 阅读全文
posted @ 2026-02-04 20:49
为啥不懂就问
阅读(3)
评论(0)
推荐(0)
摘要:
第14天:Spark项目实战1 学习目标:综合运用Spark进行数据处理和分析。 具体内容: 项目:电商用户行为分析。 数据清洗:处理缺失值、异常值。 数据分析:用户购买行为统计(按时间、商品类别等)。 数据可视化:使用Python将分析结果可视化。 任务: 完成数据清洗和统计分析,输出每日销售总额 阅读全文
posted @ 2026-02-04 20:49
为啥不懂就问
阅读(3)
评论(0)
推荐(0)
摘要:
第13天:Spark GraphX进阶 学习目标:掌握更多图算法和图计算优化。 具体内容: 连通分量(Connected Components)、三角形计数(Triangle Counting)。 图计算优化:分区策略、缓存。 练习:使用连通分量算法找出社交网络中的社区。 任务: 使用三角形计数算法 阅读全文
posted @ 2026-02-04 20:48
为啥不懂就问
阅读(1)
评论(0)
推荐(0)

浙公网安备 33010602011771号