yjyyjy

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年5月10日

摘要: 问题 对于给定的文件,应该使用多少个分区? 例如,假设我有一个10GB 文件,3个执行器,每个执行器有 2 个内核,3G内存。 我应该重新分配吗? 我应该使用多少个分区? 做出选择的更好方法是什么? 会默认重新分区么? 分析 Spark可以为一个RDD的每个分区运行一个并发任务,直到并发任务数等于集 阅读全文
posted @ 2020-05-10 17:53 闭关49天 阅读(590) 评论(0) 推荐(0) 编辑

摘要: GUI里调试Spark JOB 必须先安装好 Spark:https://www.cnblogs.com/yjyyjy/p/12860642.html 视频: https://study.163.com/course/courseLearn.htm?courseId=1210073161&share 阅读全文
posted @ 2020-05-10 05:16 闭关49天 阅读(427) 评论(0) 推荐(0) 编辑