文章分类 - Machine Learning
摘要:GBDT 概述 GBDT 是梯度提升树(Gradient Boosting Decison Tree)的简称,GBDT 也是集成学习 Boosting 家族的成员,但是却和传统的 Adaboost 有很大的不同。回顾下 Adaboost,我们是利用前一轮迭代弱学习器的误差率来更新训练集的权重,这样一
阅读全文
摘要:一.定义辨析 刚开始接触这两个概念的时候总搞混,时间一长就记不清了。 实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是 精确率 而召回率是针对我们原
阅读全文
摘要:Netflix的推荐和个性化功能向来精准,前不久,他们公布了自己在这方面的系统架构。 3月27日,Netflix的工程师Xavier Amatrain和Justin Basilico在官方博客发布文章,介绍了自己的个性化和推荐系统架构。文章开头,他们指出: 接下来,文章贴出了他们的系统框架图,其中的
阅读全文
摘要:1.示例引入 多个吃货在某美团的某家饭馆点餐,如下两道菜: 可乐鸡翅: 红烧肉: 顾客吃过后,会有相关的星级评分。假设评分如下: 评分 可乐鸡翅 红烧肉 小明 4 5 小红 4 3 小伟 2 3 小芳 3 ? 问题:请猜测一下小芳可能会给“红烧肉”打多少分? 思路:把两道菜的平均差值求出来,可乐鸡翅
阅读全文
摘要:关联规则(association rules)是一种广泛使用的模式识别方法,比如在购物篮分析(Market basket Analysis),网络连接分析(Web link),基因分析。我们常常提到的购物篮分析,它的典型的应用场景就是要找出被一起购买的商品集合。 关联规则的可能的应用场景有: 优化货
阅读全文

浙公网安备 33010602011771号