摘要: 本文基于 Spark 2.4.1 进行演示,相关代码可以在我的Github上看到。 简介 Spark是一个分布式集群计算系统,类似Hadoop提供了强大的分布式计算能力,相比过去的批量处理系统,提供了处理更大规模数据的能力。Spark提供了Java、Python、Scala、R接口。除常见的MapR 阅读全文
posted @ 2019-10-15 13:16 Cocowool 阅读(163) 评论(0) 推荐(0) 编辑