摘要: 参考:【尚硅谷 Spark】 ​ 【《大数据处理框架Apache Spark设计与实现》】 ​ 【Spark官方文档】 2. 核心编程 逻辑处理流程 1)数据源 数据源表示的是原始数据,数据可以存放在本地文件系统和分布式系统中,对于流式处理,数据源还可以是网络流等 2)数据模型 我们怎么对数据源进行 阅读全文
posted @ 2022-12-06 17:04 黄一洋 阅读(14) 评论(0) 推荐(0)
摘要: 参考:【尚硅谷 Spark】 ​ 【《大数据处理框架Apache Spark设计与实现》】 ​ 【Spark官方文档】 1. 简介 ==Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎== Spark or MapReduce ? Hadoop的 MR框架 和 Spark框架 都是 阅读全文
posted @ 2022-12-06 17:01 黄一洋 阅读(13) 评论(0) 推荐(0)