06 2019 档案

1. RDD概念
摘要:1.1 RDD为什么会产生? RDD 是 Spark 的基石,是实现 Spark 数据处理的核心抽象。那么 RDD 为 什么会产生呢? Hadoop 的 MapReduce 是一种基于数据集的工作模式,面向数据,这种工作模式一般是从存储上加载数据集,然后操作数据集,最后写入物理存储设备。数据更多面临 阅读全文

posted @ 2019-06-25 08:43 铖歌 阅读(765) 评论(0) 推荐(0)

1. Spark基础解析
摘要:1.1 Spark概述 1.1.1 什么是Spark 官网:http://spark.apache.org Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache顶级项 阅读全文

posted @ 2019-06-21 15:41 铖歌 阅读(331) 评论(0) 推荐(0)