08 2019 档案

树模型
摘要:一、简介 树模型是一种非线性模型。决策树是一种监督学习算法,输入和输出变量可以是离散值或连续值。 二、涉及到的术语 根节点、决策节点、叶子/终端节点、剪枝、分支/子树、父节点和孩子节点 特征选择、树的生成、剪枝 三、建模流程 1.缺失值填充(cart模型自动填充,id3和c4.5需要手动填充) 2. 阅读全文

posted @ 2019-08-28 17:50 静静的白桦林_andy 阅读(770) 评论(0) 推荐(0)

MS激活
摘要:亲测可用 国内博客 https://msguides.com/ 他是翻译的这个哥们的网页: https://msguides.com/ 阅读全文

posted @ 2019-08-27 17:27 静静的白桦林_andy 阅读(144) 评论(0) 推荐(0)

信贷的模式
摘要:风控的模式: 1.用户发起一笔借款,跑一次风控。 2.用户发起申请后,跑一次风控(反欺诈策略+反欺诈模型+信用模型+授信模型),给用户授信一次,在一段时间之内(比如两年)用户再过来申请借款, 都不会再重新跑风控,直到放款机构设置的重新授信时间点,才会重新跑风控和授信模型。 纯线上信贷业务合作模式: 阅读全文

posted @ 2019-08-24 19:03 静静的白桦林_andy 阅读(271) 评论(0) 推荐(0)

训练贷款模型时样本、模型、监控的一些点
摘要:一.样本 理想情况下,样本分三部分。 训练样本70% 验证样本(有时也叫测试样本)30% 跨时间验证样本:但经常这块数据没有,那也就只用前面的数据来做也可以。 二.如何确保模型训练完成 1.训练样本的roc和ks达到比较好的水平(0.7,0.3及以上) 2.验证样本和训练样本的指标差距不大(如10% 阅读全文

posted @ 2019-08-24 18:53 静静的白桦林_andy 阅读(1213) 评论(0) 推荐(0)

集成学习算法(未完成)
摘要:提升类算法相比单棵树对样本进行了样本交叉。 一、GBDT 比较好的GBDT的文章: https://www.cnblogs.com/leftnoteasy/archive/2011/03/07/random-forest-and-gbdt.html GBDT源码分析:https://www.jian 阅读全文

posted @ 2019-08-24 11:44 静静的白桦林_andy 阅读(154) 评论(0) 推荐(0)

LR及评分卡(未完成)
摘要:主要分为如下内容: 一、线性回归 二、逻辑回归 三、逻辑回归评分卡流程 一、线性回归 二、逻辑回归 在线性回归的基础上引入了sigmoid函数,Logistic回归为什么要使用sigmoid函数 三、逻辑回归评分卡流程 1.y值确定 2.变量分析(缺失值处理(对于不同模型如何处理?)、离散值处理、离 阅读全文

posted @ 2019-08-24 11:42 静静的白桦林_andy 阅读(389) 评论(0) 推荐(0)

安装python第三方包
摘要:20190822 先说一下,有4种方法(我知道的): 1.源码安装 2.python自带包管理器安装 3.外部包管理器安装 4.whl格式安装 1。源码安装 Python第三方库几乎都可以在github或者 pypi上找到源码。源码包格式大概有zip 、 tar.zip、 tar.bz2。解压这些包 阅读全文

posted @ 2019-08-22 10:13 静静的白桦林_andy 阅读(9133) 评论(0) 推荐(1)

导航