Fork me on GitHub
摘要: 三大分布式计算系统 Hadoop适合处理离线的静态的大数据; Spark适合处理离线的流式的大数据; Storm/Flink适合处理在线的实时的大数据。 前言 Spark,是分布式计算平台,是一个用scala语言编写的计算框架,基于内存的快速、通用、可扩展的大数据分析引擎。 Hadoop,是分布式管 阅读全文
posted @ 2021-06-27 11:13 薄荷加冰2060 阅读(2204) 评论(0) 推荐(0)