导航

随笔分类 -  接口开发

开发sklearn新的库
该文被密码保护。

posted @ 2018-11-03 16:54 wzd321 阅读(4) 评论(0) 推荐(0)

摘要:# -*- coding: utf-8 -*- """ Created on Wed Oct 31 20:59:39 2018 脚本描述:采用boosting思想开发一个解决二分类样本不平衡的多估计器模型 @author: WZD """ from sklearn.datasets import load_breast_cancer from sklearn.model_selection im... 阅读全文

posted @ 2018-11-01 15:44 wzd321 阅读(524) 评论(0) 推荐(0)

摘要:"gbdt":Gradient Boosting Decision Tree "dart":Dropouts meet Multiple Additive Regression Trees "goss":Gradient-based One-Side Sampling "rf": Random Fo 阅读全文

posted @ 2018-10-28 22:35 wzd321 阅读(12595) 评论(1) 推荐(0)

摘要:转载:https://zhuanlan.zhihu.com/p/38440477 转载:https://blog.csdn.net/starzhou/article/details/78930490 转载:https://www.cnblogs.com/wzdLY/p/9649101.html 1. 阅读全文

posted @ 2018-10-25 21:58 wzd321 阅读(41691) 评论(3) 推荐(1)

摘要:原理介绍:https://zhuanlan.zhihu.com/p/29779000 阅读全文

posted @ 2018-10-24 22:06 wzd321 阅读(232) 评论(0) 推荐(0)

摘要:转载:https://www.cnblogs.com/itdyb/p/8869163.html 阅读全文

posted @ 2018-10-23 23:07 wzd321 阅读(1055) 评论(0) 推荐(0)

摘要:import xgboost as xgb from sklearn.model_selection import GridSearchCV from sklearn.metrics import make_scorer from sklearn.metrics import accuracy_score from sklearn.datasets import load_breast_canc... 阅读全文

posted @ 2018-10-23 22:39 wzd321 阅读(632) 评论(0) 推荐(0)

摘要:1.模型参数 max_depth:int |每个基本学习器树的最大深度,可以用来控制过拟合。典型值是3-10 learning_rate=0.1: 即是eta,为了防止过拟合,更新过程中用到的收缩步长,使得模型更加健壮。每次提升计算之后,算法会直接获得新特征的权重,eta通过缩减特征的权重使提升计算 阅读全文

posted @ 2018-10-22 17:21 wzd321 阅读(6871) 评论(1) 推荐(2)

该文被密码保护。

posted @ 2018-10-03 11:03 wzd321 阅读(8) 评论(0) 推荐(0)

摘要:信用评定等级划分之后需要对评级的划分做出评价,分析这样的评级划分结果是否具有实用价值,即分析样本分布的稳定程度。样本分布稳定,则信用评定等级划分结果的实用价值就高。采用样本稳定指数( PSI )检验样本分布的稳定程度,若训练样本和测试样本在分布上表现一致,样本稳定指数的取值就会接近于零,信用评级划分 阅读全文

posted @ 2018-09-26 20:32 wzd321 阅读(673) 评论(0) 推荐(0)

摘要:遗传算法适应度的选择: 机器学习的适应度可以是任何性能指标 —准确度,精确度,召回率,F1分数等等。根据适应度值,我们选择表现最佳的父母(“适者生存”),作为幸存的种群。 交配: 存活下来的群体中的父母将通过交配产生后代,使用两个步骤的组合:交叉/重组和突变。 交叉:交配父母的基因(参数)将被重新组 阅读全文

posted @ 2018-09-25 17:11 wzd321 阅读(2499) 评论(2) 推荐(1)

摘要:上述代码主要完成了基于多个树模型的叶子节点输入到多个分类器或者回归器的模型融合策略,具有一定的扩展性和适应度。后面给出了一个基于随机深林和lightGBM的测试实例,供大家参考。这种模型融合策略在不同的地方效果不同,关键还是特征工程是否做得更好,该类方法在训练集上有一定的过拟合倾向。 欢迎评论和给出 阅读全文

posted @ 2018-09-19 21:37 wzd321 阅读(627) 评论(0) 推荐(0)

摘要:1.estimator: 传入估计器与不需要调参的参数,每一个估计器都需要一个scoring参数。 2.param_grid: 需要最优化的参数的取值,值为字典或者列表。 3.scoring: 模型评价标准,默认None,这时需要使用score函数,根据所选模型不同,评价准则不同。字符串或者自定义形 阅读全文

posted @ 2018-09-19 13:41 wzd321 阅读(719) 评论(0) 推荐(0)

摘要:转载:https://github.com/LearningFromBest/CMB-credit-card-department-prediction-of-purchasing-behavior-in-consumer-finance-scenario/blob/master/stacking. 阅读全文

posted @ 2018-09-18 21:58 wzd321 阅读(2345) 评论(0) 推荐(0)