会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
FireOnFire
博客园
首页
新随笔
联系
订阅
管理
2022年10月22日
SparkSQL
摘要: DataFrame DataFrame 是一种以 RDD 为基础的分布式数据集,类似于二维表格。与 RDD 的区别在于,前者带有 schema 元信息,即 DataFrame。 DataFrame 也是懒执行的,但性能上比 RDD 要高。因为优化了执行计划,查询计划通过 Spark catalyst
阅读全文
posted @ 2022-10-22 12:48 FireOnFire
阅读(75)
评论(0)
推荐(0)
公告