随笔档案「2017年6月1日」：spark读取hdfs数据本地性异常【转】 ... - XGogo

2017年6月1日

摘要：在分布式计算中，为了提高计算速度，数据本地性是其中重要的一环。不过有时候它同样也会带来一些问题。一.问题描述在分布式计算中，大多数情况下要做到移动计算而非移动数据，所以数据本地性尤其重要，因此我们往往也是将hdfs和spark部署在相同的节点上，有些人可能会发现即使他已经这么做了，在spark 阅读全文

posted @ 2017-06-01 17:40 XGogo 阅读(396) 评论(0) 推荐(0)

尧字节

明翼

公告