会员
众包
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
liyiyang
博客园
首页
新随笔
联系
管理
订阅
2024年1月28日
Spark三大数据结构之RDD算子
摘要: RDD算子 简单介绍 RDD(Resilient Distributed Dataset)是Apache Spark中的基本数据结构,它代表一个分布式、不可变的数据集。RDD提供了一系列的算子(操作符),用于在分布式计算中对数据进行转换和操作。这些算子可以分为两类:转换算子(Transformati
阅读全文
posted @ 2024-01-28 23:14 突破铁皮
阅读(54)
评论(0)
推荐(0)
编辑
公告