摘要: 什么是 Bucketing Bucketing 就是利用 buckets(按列进行分桶)来决定数据分区(partition)的一种优化技术,它可以帮助在计算中避免数据交换(avoid data shuffle)。并行计算的时候shuffle常常会耗费非常多的时间和资源. Bucketing 的基本原 阅读全文
posted @ 2020-05-15 22:25 黑客悟理 阅读(2999) 评论(0) 推荐(1) 编辑