随笔分类 - 信贷风控
风控业务与算法
摘要:在机器学习的生产环境中,我们经常需要将多个模型的预测结果进行融合,以便提高预测的准确性。这个过程通常涉及到多个模型子分的简单逻辑回归融合。虽然离线训练时我们可以直接使用sklearn的逻辑回归进行训练和调参,但在生产环境中,模型的上线往往需要使用PMML(Predictive Model Marku
阅读全文
摘要:KS,AUC 和 PSI 是风控算法中最常计算的几个指标,本文记录了多种工具计算这些指标的方法。 生成本文的测试数据: import pandas as pd import numpy as np import pyspark.sql.functions as F from pyspark.sql.
阅读全文
摘要:《个人信息保护法》8月20日通过,11月1日开始实施,app随意爬取用户信息的日子到头了
阅读全文
摘要:一、变量分箱 变量分箱常见于逻辑回归评分卡的制作中,在入模前,需要对原始变量值通过分箱映射成woe值。举例来说,如“年龄”这一变量,我们需要找到合适的切分点,将连续的年龄打散到不同的”箱“中,并按年龄落入的“箱”对变量进行编码。 关于变量分箱的作用,相关资料中的解释有很多,我认为变量分箱最主要有三个
阅读全文

浙公网安备 33010602011771号