07 2014 档案

大数据技术 —— MapReduce 简介
摘要:本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/1.概要很多计算在概念上很直观,但由于输入数据很大,为了能在合理的时间内完成,这些计算必须分布在数以百计数以千计的机器上。例如处理爬取得到的文档、网页请求日志来计算各种衍生数据,如倒排索引,网页文档... 阅读全文

posted @ 2014-07-27 17:16 senlie zheng 阅读(17414) 评论(2) 推荐(1)

机器学习 —— 决策树及其集成算法(Bagging、随机森林、Boosting)
摘要:本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/决策树---------------------------------------------------------------------1.描述:以树为基础的方法可以用于回归和分类。树的节点... 阅读全文

posted @ 2014-07-25 16:13 senlie zheng 阅读(7141) 评论(0) 推荐(1)

导航