spark
摘要:
Spark是UC Berkeley AMP lab开发的一个集群计算的框架,类似于Hadoop,但有很多的区别。最大的优化是让计算任务的中间结果可以存储在内存中,不需要每次都写入HDFS,更适用于需要迭代的MapReduce算法场景中,可以获得更好的性能提升。例如一次排序测试中,对100TB数据进行 阅读全文
posted @ 2017-10-13 23:00 懵懂的菜鸟 阅读(453) 评论(0) 推荐(0)
Stay hungry,Stay foolish.
2017年10月13日 #
posted @ 2017-10-13 23:00 懵懂的菜鸟 阅读(453) 评论(0) 推荐(0)
posted @ 2017-10-13 22:44 懵懂的菜鸟 阅读(499) 评论(0) 推荐(0)
posted @ 2017-10-13 21:05 懵懂的菜鸟 阅读(474) 评论(0) 推荐(0)
posted @ 2017-10-13 20:52 懵懂的菜鸟 阅读(258) 评论(0) 推荐(0)