随笔档案「2020年3月1日」：Spark介绍 ... - 知己一生

2020年3月1日

摘要：通常当我们计算的数据超过了单机维度，比如我们的PC内存共8G,而需要计算的数据为100G，这时候我们通常选择大数据集群进行计算。 Spark是大数据处理的计算引擎。,这是它的发展是为了解决替代Hadoop的MapReduce计算引擎。 Hadoop的架构如下，核心包括两点：Hdfs和MapReduc 阅读全文

posted @ 2020-03-01 14:51 知己一生阅读(257) 评论(0) 推荐(0)