摘要:
Borg Large-scale cluster management at Google with Borg an opportunity cost approach for job assignment in scalable computing cluster Multi-agent Clus 阅读全文
摘要:
Storm 的不足 Storm 利用异或操作实现了消息至少处理一次;kafka中利用存储在ZooKeeper的offset使得消息队列重放更加容易。Kafka和Storm组合实现了 At Least Once 消息处理机制。但只有实现“正好一次”(Exactly Once)才能得到正确的结果,为此“ 阅读全文
摘要:
Dremel 列式存储 Dremel: Interactive Analysis of Web-Scale Datasets Dremel: A Decade of Interactive SQL Analysis at Web Scale 开源项目:Parquet Hive通过分区分桶加快了扫描速 阅读全文