Mengdong的技术博客

学习,记录,分享

导航

统计

公告

《Data-intensive Text Processing with MapReduce》读书笔记(入口)2011.7.23最后更新

本文是《Data-intensive Text Processing with MapReduce》一书(豆瓣链接)读书笔记博文列表。

这是我的第一个读书笔记,其中翻译与表述不当之处,望广大网友不吝赐教。

目前的状态:正在看书,边看边写,随着看书进度更新读书笔记。

虽然进度上没有绝对保证,但将读书笔记以博文的方式发布出来,是对自己的督促。

无论如何,我将认真研读并撰写报告。更新速度为3天左右一篇。

读完以后,将持续修订。并考虑添加一些实践练习。

书名中译(待定):使用MapReduce进行密集文本数据处理

第1章:引言
http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-ch1.html

第2章:MapReduce基础

(1) http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-ch2.html

2.1 函数式编程
2.2 mapper与reducer

(2) http://www.cnblogs.com/mdyang/archive/2011/07/02/data-intensive-text-prcessing-with-mapreduce-ch2_2.html

2.3 MapReduce执行框架
2.4 划分器(Partitioner)与合并器 (Combiner)

(3) http://www.cnblogs.com/mdyang/archive/2011/07/05/data-intensive-text-prcessing-with-mapreduce-ch2_3.html

2.5 分布式文件系统HDFS

(4) http://www.cnblogs.com/mdyang/archive/2011/07/08/data-intensive-text-prcessing-with-mapreduce-ch2_4.html

2.6 Hadoop集群架构
2.7 总结 

第3章:MapReduce算法基础(已完结)

(1) http://www.cnblogs.com/mdyang/archive/2011/07/12/data-intensive-text-prcessing-with-mapreduce-ch3_1.html

引言
3.1 局部合并 

(2) http://www.cnblogs.com/mdyang/archive/2011/07/14/data-intensive-text-prcessing-with-mapreduce-ch3_2.html

3.2 对(pairs)与带(stripes)

(3) http://www.cnblogs.com/mdyang/archive/2011/07/18/data-intensive-text-prcessing-with-mapreduce-ch3_3.html

3.3 计算相对频度(relative frequency,频率)

(4) http://www.cnblogs.com/mdyang/archive/2011/07/20/data-intensive-text-prcessing-with-mapreduce-ch3_4.html

3.4 二次排序

(5) http://www.cnblogs.com/mdyang/archive/2011/07/23/data-intensive-text-prcessing-with-mapreduce-ch3_5.html

3.5 关系连接
总结

因为最近工作比较忙,没有时间继续写这本书的读书笔记,所以本系列将会暂停一段时间。

posted on 2011-06-29 16:17 mdyang 阅读(...) 评论(...) 编辑 收藏