上一页 1 2 3 4 5 6 7 8 9 10 ··· 16 下一页
摘要: 在前段时间做本科毕业设计的时候,遇到了各个类别的样本量分布不均的问题——某些类别的样本数量极多,而有些类别的样本数量极少,也就是所谓的类不平衡(class-imbalance)问题。 本篇简述了以下内容: 什么是类不平衡问题 为什么类不平衡是不好的 几种解决方案 SMOTE过采样算法 进一步阅读 什 阅读全文
posted @ 2018-02-06 16:59 Earendil 阅读(307) 评论(0) 推荐(1)
摘要: 在做阿里的o2o优惠券预测的时候学习了GBDT。听闻GBDT的威力,自然要学习学习。 接下来从以下几个方面记录下我对于GBDT的理解。 GBDT的用途,优势 GBDT的结构和算法流程 GBDT如何训练 Sklearn 的GBDT使用,参数意义 GBDT的用途,优势: GBDT(Gradient Bo 阅读全文
posted @ 2018-01-24 15:51 Earendil 阅读(414) 评论(0) 推荐(1)
摘要: 1、使用pip简单安装 First, make sure you obtained gcc-5 (newer version does not work with this method yet). Note: installation of gcc can take a while (~ 30 m 阅读全文
posted @ 2018-01-23 11:21 Earendil 阅读(196) 评论(0) 推荐(1)
摘要: XGBoost 与 Boosted Tree http://www.52cs.org/?p=429 作者:陈天奇,毕业于上海交通大学ACM班,现就读于华盛顿大学,从事大规模机器学习研究。 注解:truth4sex 编者按:本文是对开源xgboost库理论层面的介绍,在陈天奇原文《梯度提升法和Boos 阅读全文
posted @ 2018-01-19 14:51 Earendil 阅读(235) 评论(0) 推荐(0)
摘要: new_value = (value - min)/(max-min) 阅读全文
posted @ 2018-01-18 18:09 Earendil 阅读(4512) 评论(0) 推荐(0)
摘要: 前言: 刚开始看到线性回归,总觉得这是不是和罗辑回归又啥关系。 对比一下吧。 线性回归用于数值预测,罗辑回归用于分类。 对于罗辑回归 来说,用于分类的神经网络的最后一层也是一个罗辑回归。 线性回归: 线性回归比较简单,找到一条最佳直线来拟合数据。拟合的目标可以是均方误差最小。 求最优的线性回归直线的 阅读全文
posted @ 2018-01-11 17:48 Earendil 阅读(207) 评论(0) 推荐(1)
摘要: (很多讲逻辑回归的文章都没有给出详细的推导,只是列出最后的计算公式,今天在网上看到一篇解释得非常详细的文章,赶紧转载一下: 【机器学习笔记1】Logistic回归总结(http://blog.csdn.net/dongtingzhizi/article/details/15962797) 作者说"未 阅读全文
posted @ 2018-01-11 15:40 Earendil 阅读(1319) 评论(4) 推荐(0)
摘要: KNN与Kmeans感觉没啥联系,但是名字挺像的,就拿来一起总结一下吧。 初学者的总结。 KNN是监督学习,Kmeans是无监督学习。 KNN用于分类,Kmeans用于聚类。 先说KNN: 对于KNN,有一批已经标注好label的训练样本,将这批样本的数据转换为向量表示,然后选择度量向量距离的方式。 阅读全文
posted @ 2018-01-10 09:53 Earendil 阅读(962) 评论(0) 推荐(0)
摘要: RDD全称叫做弹性分布式数据集(Resilient Distributed Datasets),它是一种分布式的内存抽象,表示一个只读的记录分区的集合,它只能通过其他RDD转换而创建,为此,RDD支持丰富的转换操作(如map, join, filter, groupBy等),通过这种转换操作,新的R 阅读全文
posted @ 2018-01-05 16:06 Earendil 阅读(724) 评论(0) 推荐(0)
摘要: 基于邻域的算法是推荐系统中最基本的算法,该算法不仅在学术界得到了深入研究,而且在 业界得到了广泛应用。基于邻域的算法分为两大类,一类是基于用户的协同过滤算法,另一类是 基于物品的协同过滤算法。 基于用户的协同过滤算法: 该算法主要分为两个步骤: (1)找到和目标用户兴趣相似的用户的集合 (2)找到集 阅读全文
posted @ 2018-01-05 15:59 Earendil 阅读(2115) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 16 下一页