随笔分类 -  分布式

摘要:原文链接The logging model used by Dynamo provides a flexible mechanism for setting up complex application logging rules. With a combination of filters and... 阅读全文
posted @ 2016-01-20 17:25 masic 阅读(269) 评论(0) 推荐(0)
摘要:来自董飞的回答HBase:是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化数据集群。像Facebook,都拿它做大型实时应用Facebook's New Realtime Analytics System: HBase to P... 阅读全文
posted @ 2015-06-15 22:52 masic 阅读(430) 评论(0) 推荐(0)
摘要:原文链接什么是SparkApache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。首先,... 阅读全文
posted @ 2015-06-09 17:56 masic 阅读(321) 评论(0) 推荐(0)