上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 48 下一页
摘要: // 创建 Spark 运行配置对象 val sparkConf = new SparkConf().setMaster("local[*]").setAppName("WordCount") // 创建 Spark 上下文环境对象(连接对象) val sc : SparkContext = new 阅读全文
posted @ 2022-02-09 22:23 青竹之下 阅读(39) 评论(0) 推荐(0)
摘要: 创建 Maven 项目 2.1.1 增加 Scala 插件 Spark 由 Scala 语言开发的,所以本课件接下来的开发所使用的语言也为 Scala,咱们当 前使用的 Spark 版本为 3.0.0,默认采用的 Scala 编译版本为 2.12,所以后续开发时。我们依 然采用这个版本。开发前请保证 阅读全文
posted @ 2022-02-09 22:21 青竹之下 阅读(52) 评论(0) 推荐(0)
摘要: 在 Spark 中创建 RDD 的创建方式可以分为四种: 1) 从集合(内存)中创建 RDD 从集合中创建 RDD,Spark 主要提供了两个方法:parallelize 和 makeRDD val sparkConf = new SparkConf().setMaster("local[*]"). 阅读全文
posted @ 2022-01-25 21:48 青竹之下 阅读(81) 评论(0) 推荐(0)
摘要: 从计算的角度来讲,数据处理过程中需要计算资源(内存 & CPU)和计算模型(逻辑)。 执行时,需要将计算资源和计算模型进行协调和整合。 Spark 框架在执行时,先申请资源,然后将应用程序的数据处理逻辑分解成一个一个的 计算任务。然后将任务发到已经分配资源的计算节点上, 按照指定的计算模型进行数据计 阅读全文
posted @ 2022-01-24 21:55 青竹之下 阅读(94) 评论(0) 推荐(0)
摘要: Spark 计算框架为了能够进行高并发和高吞吐的数据处理,封装了三大数据结构,用于 处理不同的应用场景。三大数据结构分别是: ➢ RDD : 弹性分布式数据集 ➢ 累加器:分布式共享只写变量 ➢ 广播变量:分布式共享只读变 RDD(Resilient Distributed Dataset)叫做弹性 阅读全文
posted @ 2022-01-24 21:41 青竹之下 阅读(42) 评论(0) 推荐(0)
摘要: Client 模式将用于监控和调度的 Driver 模块在客户端执行,而不是在 Yarn 中,所以一 般用于测试。 ➢ Driver 在任务提交的本地机器上运行 ➢ Driver 启动后会和 ResourceManager 通讯申请启动 ApplicationMaster ➢ ResourceMan 阅读全文
posted @ 2022-01-23 21:54 青竹之下 阅读(263) 评论(0) 推荐(0)
摘要: 运行架构 Spark 框架的核心是一个计算引擎,整体来说,它采用了标准 master-slave 的结构。 如下图所示,它展示了一个 Spark 执行时的基本结构。图形中的 Driver 表示 master, 负责管理整个集群中的作业任务调度。图形中的 Executor 则是 slave,负责实际执 阅读全文
posted @ 2022-01-22 22:48 青竹之下 阅读(111) 评论(0) 推荐(0)
摘要: K8S & Mesos 模式 Mesos 是 Apache 下的开源分布式资源管理框架,它被称为是分布式系统的内核,在 Twitter 得到广泛使用,管理着 Twitter 超过 30,0000 台服务器上的应用部署,但是在国内,依 然使用着传统的 Hadoop 大数据框架,所以国内使用 Mesos 阅读全文
posted @ 2022-01-21 22:41 青竹之下 阅读(415) 评论(0) 推荐(0)
摘要: 独立部署(Standalone)模式由 Spark 自身提供计算资源,无需其他框架提供资源。这 种方式降低了和其他第三方资源框架的耦合性,独立性非常强。但是你也要记住,Spark 主 要是计算框架,而不是资源调度框架,所以本身提供的资源调度并不是它的强项,所以还是 和其他专业的资源调度框架集成会更靠 阅读全文
posted @ 2022-01-20 22:46 青竹之下 阅读(85) 评论(0) 推荐(0)
摘要: bin/spark-submit \ --class <main-class> --master <master-url> \ ... # other options <application-jar> \ [application-arguments] 由于 spark-shell 停止掉后,集群 阅读全文
posted @ 2022-01-19 11:09 青竹之下 阅读(78) 评论(0) 推荐(0)
上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 48 下一页