会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zbl040721
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
19
下一页
2025年2月5日
2025.2.5
摘要: 学习内容:处理无界数据集。Stateful操作与事件时间处理。故障恢复与容错机制。
阅读全文
posted @ 2025-02-05 21:05 Verneyyx
阅读(8)
评论(0)
推荐(0)
2025年2月4日
2025.2.4
摘要: 学习内容:Structured Streaming与传统Streaming的区别。Output Modes(Append、Update、Complete)。Watermark机制。
阅读全文
posted @ 2025-02-04 21:37 Verneyyx
阅读(8)
评论(0)
推荐(0)
2025年2月3日
2025.2.3
摘要: 学习内容:Catalyst优化器的工作原理。Tungsten项目的作用。数据分区与广播连接。
阅读全文
posted @ 2025-02-03 21:43 Verneyyx
阅读(23)
评论(0)
推荐(0)
2025年2月2日
2025.2.2
摘要: 学习内容:推荐系统(ALS算法)。深度学习与Spark的结合。模型持久化与部署。
阅读全文
posted @ 2025-02-02 00:22 Verneyyx
阅读(5)
评论(0)
推荐(0)
2025年2月1日
2025.2.1
摘要: 学习内容:背压机制(Backpressure)。数据批处理与延迟优化。内存管理与序列化。
阅读全文
posted @ 2025-02-01 22:48 Verneyyx
阅读(17)
评论(0)
推荐(0)
2025年1月31日
2025.1.31
摘要: 学习内容:配置Spark集群。日志管理和错误排查。常见问题及解决方案。
阅读全文
posted @ 2025-01-31 21:05 Verneyyx
阅读(7)
评论(0)
推荐(0)
2025年1月30日
2025.1.30
摘要: 学习内容:并行度设置(partition数)。数据本地性与Shuffle优化。使用Spark UI监控作业。
阅读全文
posted @ 2025-01-30 21:10 Verneyyx
阅读(19)
评论(0)
推荐(0)
2025年1月29日
2025.1.29
摘要: 学习内容:图计算的基本概念。GraphX的数据结构(VertexRDD、EdgeRDD)。基本图算法(PageRank、最短路径等)。
阅读全文
posted @ 2025-01-29 21:39 Verneyyx
阅读(9)
评论(0)
推荐(0)
2025年1月28日
2025.1.28
摘要: 学习内容:MLlib支持的算法(分类、回归、聚类等)。数据预处理和特征提取。模型训练与评估。
阅读全文
posted @ 2025-01-28 21:40 Verneyyx
阅读(11)
评论(0)
推荐(0)
2025年1月27日
2025.1.27
摘要: 学习内容:窗口操作和滑动窗口。更新状态和检查点机制。Kafka与Spark Streaming的集成。
阅读全文
posted @ 2025-01-27 23:40 Verneyyx
阅读(9)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
19
下一页
公告