摘要: 目录 一、Spark中的基本概念 二、Spark的运行流程 2.1 Spark的基本运行流程 三、Spark在不同集群中的运行架构 3.1 Spark on Standalone运行过程 3.2 Spark on YARN运行过程 正文 回到顶部 一、Spark中的基本概念 (1)Applicati 阅读全文
posted @ 2021-01-11 17:41 大浪不惊涛 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 目录 Transformation算子 基本的初始化 一、map、flatMap、mapParations、mapPartitionsWithIndex 1.1 map 1.2 flatMap 1.3 mapPartitions 1.4 mapPartitionsWithIndex 二、reduce 阅读全文
posted @ 2021-01-11 14:25 大浪不惊涛 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 目录 一、JDK的安装 1.1 上传安装包并解压 1.2 配置环境变量 1.3 验证Java版本 二、配置配置ssh localhost 2.1 检测 2.2 生成私钥和公钥秘钥对 2.3 将公钥添加到authorized_keys 2.4 赋予authorized_keys文件600的权限 2.5 阅读全文
posted @ 2021-01-11 14:24 大浪不惊涛 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 目录 一、概述 二、广播变量broadcast variable 2.1 为什么要将变量定义成广播变量? 2.2 广播变量图解 2.3 如何定义一个广播变量? 2.4 如何还原一个广播变量? 2.5 定义广播变量需要的注意点? 2.6 注意事项 三、累加器 3.1 为什么要将一个变量定义为一个累加器 阅读全文
posted @ 2021-01-11 11:54 大浪不惊涛 阅读(119) 评论(0) 推荐(0) 编辑