文章分类 -  Machine Learning

摘要:GBDT 概述 GBDT 是梯度提升树(Gradient Boosting Decison Tree)的简称,GBDT 也是集成学习 Boosting 家族的成员,但是却和传统的 Adaboost 有很大的不同。回顾下 Adaboost,我们是利用前一轮迭代弱学习器的误差率来更新训练集的权重,这样一 阅读全文
posted @ 2020-01-19 17:28 Allen101 阅读(1897) 评论(0) 推荐(0)
摘要:一.定义辨析 刚开始接触这两个概念的时候总搞混,时间一长就记不清了。 实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是 精确率 而召回率是针对我们原 阅读全文
posted @ 2019-12-26 14:35 Allen101 阅读(168) 评论(0) 推荐(0)
摘要:Netflix的推荐和个性化功能向来精准,前不久,他们公布了自己在这方面的系统架构。 3月27日,Netflix的工程师Xavier Amatrain和Justin Basilico在官方博客发布文章,介绍了自己的个性化和推荐系统架构。文章开头,他们指出: 接下来,文章贴出了他们的系统框架图,其中的 阅读全文
posted @ 2017-10-17 20:20 Allen101 阅读(376) 评论(0) 推荐(0)
摘要:1.示例引入 多个吃货在某美团的某家饭馆点餐,如下两道菜: 可乐鸡翅: 红烧肉: 顾客吃过后,会有相关的星级评分。假设评分如下: 评分 可乐鸡翅 红烧肉 小明 4 5 小红 4 3 小伟 2 3 小芳 3 ? 问题:请猜测一下小芳可能会给“红烧肉”打多少分? 思路:把两道菜的平均差值求出来,可乐鸡翅 阅读全文
posted @ 2017-10-11 14:55 Allen101 阅读(325) 评论(0) 推荐(0)
摘要:关联规则(association rules)是一种广泛使用的模式识别方法,比如在购物篮分析(Market basket Analysis),网络连接分析(Web link),基因分析。我们常常提到的购物篮分析,它的典型的应用场景就是要找出被一起购买的商品集合。 关联规则的可能的应用场景有: 优化货 阅读全文
posted @ 2017-10-08 21:07 Allen101 阅读(8412) 评论(0) 推荐(0)