摘要: Bigtable:一个分布式的结构化数据存储系统译者:alex摘要Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google的很多项目使用Bigtable存储数据,包括Web索引、Google Earth、Google Fi... 阅读全文
posted @ 2015-05-02 19:03 fuyifeng 阅读(161) 评论(0) 推荐(0)
摘要: 摘要MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间valu... 阅读全文
posted @ 2015-05-02 19:01 fuyifeng 阅读(106) 评论(0) 推荐(0)
摘要: 摘要我们设计并实现了Google文件系统,一个面向分布式数据密集型应用的、可伸缩的分布式文件系统。虽然运行在廉价的日用硬件设备上,但是它依然了提供容错功能,为大量客户机提供了很高的总体性能。虽然与很多之前的分布式文件系统有很多相同目标,但是,我们的设计已经受应用的负载情况和技术环境影响,现在以及可预... 阅读全文
posted @ 2015-05-02 19:00 fuyifeng 阅读(203) 评论(0) 推荐(0)
摘要: 本文系《Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing》译文。原文地址:http://www.eecs.berkeley.edu/Pubs/TechRpts/20... 阅读全文
posted @ 2015-05-02 18:37 fuyifeng 阅读(343) 评论(0) 推荐(0)
摘要: 第三章 进程管理1. fork系统调用从内核返回两次: 一次返回到子进程,一次返回到父进程2. task_struct结构是用slab分配器分配的,2.6以前的是放在内核栈的栈底的;所有进程的task_struct连在一起组成了一个双向链表3. 2.6内核的内核栈底放的是thread_info结构,... 阅读全文
posted @ 2015-04-11 14:38 fuyifeng 阅读(1970) 评论(0) 推荐(0)