摘要: 接上文内存优化用以下三张表,做性能测试RDD1.1.1cacheimport org.apache.spark.SparkConfimport org.apache.spark.sql.{Row, SparkSession}object MemoryTuning { def main(args: A 阅读全文
posted @ 2022-10-30 23:00 LEEPINE 阅读(279) 评论(0) 推荐(0)
摘要: 内存优化用以下三张表,做性能测试RDD1.1.1cacheimport org.apache.spark.SparkConfimport org.apache.spark.sql.{Row, SparkSession}object MemoryTuning { def main(args: Arra 阅读全文
posted @ 2022-10-30 22:57 LEEPINE 阅读(601) 评论(0) 推荐(0)
摘要: 第1章 集群环境概述 1.1 集群配置概述 本课程所用集群由5台节点构成,其中2台为master节点,用于部署HDFS的NameNode,Yarn的ResourceManager等角色,另外3台为worker节点,用于部署HDFS的DataNode、Yarn的NodeManager等角色。 Mast 阅读全文
posted @ 2022-10-30 22:22 LEEPINE 阅读(568) 评论(0) 推荐(0)
摘要: 资源配置调优 Flink性能调优的第一步,就是为任务分配合适的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略。 提交方式主要是yarn-per-job,资源的分配在使用脚本提交Flink任务时进行指定。 标准的Flink任 阅读全文
posted @ 2022-10-30 22:09 LEEPINE 阅读(2294) 评论(0) 推荐(1)
摘要: 第1章 Explain查看执行计划 Spark 3.0 大版本发布,Spark SQL 的优化占比将近 50%。Spark SQL 取代 Spark Core,成为新一代的引擎内核,所有其他子框架如 Mllib、Streaming 和 Graph,都可以共享 Spark SQL 的性能优化,都能从 阅读全文
posted @ 2022-10-30 22:08 LEEPINE 阅读(1597) 评论(0) 推荐(1)