2020年9月26日

SPARK学习笔记

摘要: SPARK系统架构 Hadoop虽然已成为大数据技术的事实标准,最主要的缺陷是其MapReduce计算模型延迟过高以及磁盘IO开销大,无法胜任实时、快速计算的需求,因而只适用于离线批处理的应用场景。 SPARK相比于Hadoop的优势, 1)Spark提供了内存计算, 大大减少了IO开销,中间结果直 阅读全文

posted @ 2020-09-26 12:01 淡如清风 阅读(188) 评论(0) 推荐(0)

导航