随笔分类 - 1搭建金融信贷中的机器学习模型
摘要:一、评价分类结果 分类算法的评价:仅仅使用分类准确度可靠吗? 问题:有一个癌症预测系统,输入体检信息,可以判断是否有癌症。预测准确度:99.9%,是好?是坏? 假如癌症产生的概率只有0.1%,我们的系统预测所有人都是健康,即可达到99.9的准度率! 因此对于极度偏斜(Skewed Data)的数据,
阅读全文
摘要:组合模型在信贷风控中的应用 简介:在包括违约预测在内的诸多场景中,越来越多的建模人员将模型集成的方式应用在实际工作中,并且取得了不错的成效。本节课将介绍三种基本的集成方式:Bagging,boosting,stacking。 目录: 1.元模型与集成模型 2.多模型的bagging 3.多模型的boosting 4.多模型的stacking 1.元模型与集成模型 什么是集成模型:把多种单一问题组合...
阅读全文
摘要:模型的验证、监控与调优 简介:得到评分卡模型后,还需要验证模型的性能。并且部署后还要持续监测模型的表现。 目录: 模型的区分度 模型的预测性与混淆矩阵 模型的平稳性 模型的调优 模型的区分度 区分度的概念 评分模型的作用是通过分数将好坏人群进行区分。从分数的性质可以看出,好的评分模型下违约人群的分数低、非违约人群的分数高。反之坏的评分模型下违约与非违约人群的分数是几乎无法区分的。在理想模型里,所有...
阅读全文
摘要:逻辑回归模型在评分卡开发中的应用 课程简介:在分类场景中,逻辑回归模型是常用的一类算法。它具有结构简单、可解释性强、输出结果是"软分类"的特点。评分模型多采用这类算法。同时逻辑回归模型也面临一些限制,因此在特征工程阶段我们对输入特征做了相应的调整和约束。 目录: 逻辑回归模型的基本概念 基于逻辑回归模型的评分卡构建工作 尺度化 1. 逻辑回归模型的基本概念 伯努利概型 在分类模型中,目标变量是离散...
阅读全文
摘要:申请评分卡模型 数据的预处理与特征构建(续) 课程简介:逻辑回归模型的特征需要是数值型,因此类别型变量不能直接放入模型中去,需要对其进行编码。此外,为了获取评分模型的稳定性,建模时需要对数值型特征做分箱的处理。最终在带入模型之前,我们还需要对特征做单变量与多变量分析的工作。 目录: 特征的分箱 WO
阅读全文
摘要:申请评分卡模型 数据的预处理与特征构建 简介:在构建评分卡模型的工作中,数据的预处理和特征构建工作是至关重要的一步。数据的预处理工作可以有效处理缺失值与异常值,从而增强模型的稳健性。而特征构建工作则可以将信息从字段中加以提炼,形成有业务含义的优异特征。 评分卡模型的简介 风控场景中的评分卡: 以分数形式来衡量风险几率的一种手段 是对未来一段时间内违约/逾期/失联概率的预测 有一个明确的(正)区间 ...
阅读全文
摘要:建模工作就是从上述三个文件中对数据迚行加工,提取特征幵建立合适的模型,对贷后表现做预测。
阅读全文

浙公网安备 33010602011771号