超越MapReduce的并行大数据处理
9.1:基于迭代处理平台的并行算法


不动点:

核心观点:

迭代例析:
1.PageRank(网络连接分析)
mapreduce中的实现:

存在的问题:

2.传递闭包

存在的问题:

3.K-means算法

存在的问题:

解决方法:缓存迭代


Reducer输入缓存:

Reducer的输出缓存:

Mapper的输入缓存:

体系结构:

9.2基于图处理平台的并行算法


pregel和mapreduce的不同之处:

系统的安装:


例子:计算子图同构
方法概述:

1.查询分解:

2.搜索:

3.join:


浙公网安备 33010602011771号