2015年8月21日

Spark 中的join方式(pySpark)

摘要: spark基础知识请参考spark官网:http://spark.apache.org/docs/1.2.1/quick-start.html 无论是mapreduce还是spark ,分布式框架的性能优化方向大致分为:负载均衡、网络传输和磁盘I/O 这三块。而spark是基于内存的计算框架,... 阅读全文

posted @ 2015-08-21 15:53 Tylor 阅读(23792) 评论(0) 推荐(0) 编辑

导航