随笔分类 -  Spark

摘要:## 01、Spark安装与配置 ### 1、hadoop回顾 Hadoop是分布式计算引擎,含有四大模块,common、hdfs、mapreduce和yarn。 ### 2、并发和并行 并发通常指针对单个节点的应对多个请求的能力,是单一节点上计算能力的衡量,并行通常针对集群来讲,是利用多个节点进行分布式协同作业,我们称之为并行计算。 ### 3、Spark 快如闪电集群计算引擎,应用于大... 阅读全文
posted @ 2018-08-27 18:22 大道至简(老徐) 阅读(225) 评论(0) 推荐(0)