摘要: Abstract This paper presents a new open sourced gradients boosting library that successfully handles categorical features and outperforms other gradie 阅读全文
posted @ 2020-05-06 10:36 louieworth 阅读(711) 评论(0) 推荐(0) 编辑
摘要: 论文链接: https://arxiv.org/abs/2004.01461 github: https://github.com/Yonghongwei/Gradient Centralization 1. 综述 这篇论文是由阿里达摩院和香港理工大学共同合作。这篇文章相较于传统对于神经网络(dee 阅读全文
posted @ 2020-04-15 22:20 louieworth 阅读(549) 评论(0) 推荐(0) 编辑
摘要: 为什么返回的是布尔变量? 当我们输入一个空指针应该返回什么?0?无法区别无效数组和最大数组为0的情况 考虑所有都是负值的边界情况,因为初始值为0 阅读全文
posted @ 2020-04-11 17:05 louieworth 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 1.随机森林模型怎么处理异常值? 隨机森:林是已故统计学家Leo Breiman提出的,和gradient boosted tree—样,它的基模型是决策树。在介绍RF时,Breiman就提出两种解决缺失值的方去 (Random forests classification description) 阅读全文
posted @ 2020-04-01 09:23 louieworth 阅读(2629) 评论(0) 推荐(0) 编辑
摘要: 本文作者用python代码示例解释了3种处理不平衡数据集的可选方法,包括数据层面上的2种重采样数据集方法和算法层面上的1个集成分类器方法。 分类是机器学习最常见的问题之一,处理它的最佳方法是从分析和探索数据集开始,即从探索式数据分析(Exploratory Data Analysis, EDA)开始 阅读全文
posted @ 2020-03-31 11:49 louieworth 阅读(4054) 评论(0) 推荐(0) 编辑
摘要: Abstract Gradient Boosting Decision Tree (GBDT)非常流行却鲜有实现,只有像XGBoost和pGBRT实现。当特征维度较高和数据量巨大的时候,仍然存在效率和可扩展性的问题。一个主要原因就是对于每一个特征的每一个分裂点,都需要遍历全部数据计算信息增益,这一过 阅读全文
posted @ 2020-03-28 10:30 louieworth 阅读(1003) 评论(0) 推荐(0) 编辑
摘要: 导读: 最近 self supervised learning 变得非常火,首先是 kaiming 的 MoCo 引发一波热议,然后最近 Yann 在 AAAI 上讲 self supervised learning 是未来。所以觉得有必要了解一下 SSL,也看了一些 paper 和 blog,最后 阅读全文
posted @ 2020-03-22 12:02 louieworth 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 支持向量机(SVM)本身是针对二分类问题提出的,而SVR(支持向量回归)是SVM(支持向量机)中的一个重要的应用分支。SVR回归与SVM分类的区别在于,SVR的样本点最终只有一类,它所寻求的最优超平面不是SVM那样使两类或多类样本点分的“最开”,而是使所有的样本点离着超平面的总偏差最小。 ​ SVM 阅读全文
posted @ 2020-03-22 09:06 louieworth 阅读(3288) 评论(0) 推荐(0) 编辑
摘要: 一:如何判断调参范围是否合理 正常来说,当我们参数在合理范围时,模型在训练集和测试集的准确率都比较高;当模型在训练集上准确率比较高,而测试集上的准确率比较低时,模型处于过拟合状态;当模型训练集和测试集上准确率都比较低,模型处于欠拟合状态。正常来说测试集上的准确率都会比训练集要低。 二:如何确定参数的 阅读全文
posted @ 2020-03-19 17:06 louieworth 阅读(929) 评论(0) 推荐(0) 编辑
摘要: 支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上。 置信风险: 分类器对 未知样本进行分类,得到的误差。经验风险: 训练好的分类器,对训练样本重新分类得到的误差。即样本误差结构风险:置信风险 + 经验风险结构风险最小化就是为了防止过拟合而提出来的策略,贝叶斯估计中最大后验概率 阅读全文
posted @ 2020-03-14 09:08 louieworth 阅读(1624) 评论(0) 推荐(0) 编辑