摘要: 《集体智慧编程》以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。 阅读全文
posted @ 2008-12-03 18:27 博文视点 阅读(396) 评论(0) 推荐(0) 编辑
摘要: 《设计模式——基于C#的工程化实现及扩展》这本书的目录经过前面几轮的调研、分析及修改,已经较为生动了。本书目录与正文的骨架已经搭建完备,但血肉还不够丰满。讨论会上周老师建议要做一个问答集,并推荐我们请教一下《编程之美》的作者之一刘铁锋,他也曾是武汉博文团队的策划编辑,06年到微软亚洲研究院,与邹欣老师合作了《编程之美》一书,他既有编辑经验又有作者经验。在博文期间,他还负责策划了《SQL Server 2005数据库开发详解》,这本书中就有他自己设计的编辑与作者的问答对话集,很好的展现了 “贴近读者”的理念,但是感觉自己技巧性还不够,思路也不够清晰。正好得知铁锋从北京回汉,到公司来坐坐,我和这本书的营销编辑小林子就立马拉着他请教了一番。他说的几句话对我们而言有醍醐灌顶的作用——就是做书的根本目的还是贴近读者,是为读者服务的。那么我们做的每一个策划动作,都必须站在读者的角度来考虑,是否为读者学习带来帮助,是否能展示挖掘出作者真正的内在价值。 阅读全文
posted @ 2008-12-03 14:53 博文视点 阅读(379) 评论(0) 推荐(0) 编辑