Mengdong的技术博客

学习,记录,分享

导航

上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页

2011年7月12日 #

《Data-intensive Text Processing with MapReduce》读书笔记第3章:MapReduce算法设计(1)

摘要: 爽约了。本来应该昨天更新的,结果昨天收到刚买的Focus手机过于兴奋把正事忘记了,十分抱歉!本读书笔记的目录地址:http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html引言MapReduce的强大很大程度上来自于它的简单,程序员只需要准备以下几个要素:输入数据mapper和reducer划分器与合并器(这两个是可选的)但另一方面,这意味着所有希望使用MapReduce实现的算法都得以MapReduce模型特有的方式表达(map-redu 阅读全文

posted @ 2011-07-12 09:57 mdyang 阅读(2498) 评论(2) 推荐(0) 编辑

2011年7月9日 #

《集体智慧编程》第2章:推荐

摘要: 本书读书笔记目录:http://www.cnblogs.com/mdyang/archive/2011/07/07/PCI-contents.html第2章 推荐想得到电影推荐的时候怎么做?最原始的做法就是问自己的朋友。一开始,你会要求大多数朋友给你推荐电影,经过一段时间,你发现有些朋友比别人”有眼光“。这实际上意味着相对于别人,这些朋友与你具有更高的偏好相似度,因此他们喜欢的电影你很可能也会喜欢。这样一来,你自然就会更关注那些他们看过觉得不错,而你还没有看过的电影。这种就是众多协同过滤(collaborativefiltering)技术的来源。收集评价信息本章构建一个电影推荐程序,程序基于几 阅读全文

posted @ 2011-07-09 10:39 mdyang 阅读(1594) 评论(1) 推荐(2) 编辑

2011年7月8日 #

《Data-intensive Text Processing with MapReduce》读书笔记第2章:MapReduce基础(4)

摘要: 本读书笔记的目录地址:http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html2.6 Hadoop集群架构图2.6 完整的Hadoop集群架构将上面的所有功能模块整合起来,我们就可以得到完整的Hadoop集群架构(如图2.6):1) HDFS namenode上运行namenode守护进程(daemon)2) 工作提交节点(job submission node)上运行工作追踪器(jobtracker),这种节点直接与客户端连接,接受Ma 阅读全文

posted @ 2011-07-08 09:32 mdyang 阅读(1038) 评论(2) 推荐(0) 编辑

2011年7月7日 #

《集体智慧编程》前言、第1章:集体智慧

摘要: 本书读书笔记目录:http://www.cnblogs.com/mdyang/archive/2011/07/07/PCI-contents.html前言(本书于2007年由O’Reilly出版)Internet上由用户创造的献数据正在不断增加。这些数据暗含了用户的经历、喜好、行为特征等信息,因此对于商务决策、市场运作有很大价值。本书介绍一个正在崛起的领域——集体智慧。本书的目标是让你能设计可以更聪明的程序,这些程序可以分析你获得的数据,从而帮你构建超越简单数据后台管理程序的应用。本书主要涵盖数据挖掘、机器学习、搜索等领域的基础算法。要求本书中的代码全部使用Python边写,因此要求具有一定的 阅读全文

posted @ 2011-07-07 14:02 mdyang 阅读(789) 评论(0) 推荐(0) 编辑

《集体智慧编程》目录(2011.7.14最后更新)

摘要: 前言本文是《Programming Collective Intelligence》的读书笔记目录。说实话,这本书的中文名着实让我纠结。乍看书名,我还以为是讲团队合作的呢。但如果不用这个书名,估计看到的人也不知道我说的是《Programming Collective Intelligence》这本书吧=_=真的翻开了书才发现都是一些实用的数据处理算法,涉及数据挖掘、人工智能/机器学习、搜索/ranking等多个领域的基础知识。本书为了突出实用性与易读性,避免了晦涩的形式化数学表述。涉及算法几乎全部来源于实例,且都用Python代码描述。对于希望快速上手上述领域算法设计的程序员是一本不可多得的好 阅读全文

posted @ 2011-07-07 13:59 mdyang 阅读(1287) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页