yetang307

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2024年1月30日

摘要: 1. DataFrame因为存储的是二维表数据结构,可以被针对,所以可以 自动优化执行流程。 2. 自动优化依赖Catalyst优化器 3. 自动优化2个大的优化项是:1. 断言(谓词)下推(行过滤) 2. 列 值裁剪(列过滤) 4. DataFrame代码在被优化有,最终还是被转换成RDD去执行 阅读全文
posted @ 2024-01-30 22:52 椰糖 阅读(7) 评论(0) 推荐(0) 编辑