随笔分类 -  信贷风控

风控业务与算法
摘要:在机器学习的生产环境中,我们经常需要将多个模型的预测结果进行融合,以便提高预测的准确性。这个过程通常涉及到多个模型子分的简单逻辑回归融合。虽然离线训练时我们可以直接使用sklearn的逻辑回归进行训练和调参,但在生产环境中,模型的上线往往需要使用PMML(Predictive Model Marku 阅读全文
posted @ 2024-03-12 18:19 AKA栗子 阅读(628) 评论(0) 推荐(0)
摘要:KS,AUC 和 PSI 是风控算法中最常计算的几个指标,本文记录了多种工具计算这些指标的方法。 生成本文的测试数据: import pandas as pd import numpy as np import pyspark.sql.functions as F from pyspark.sql. 阅读全文
posted @ 2021-12-14 16:21 AKA栗子 阅读(4487) 评论(0) 推荐(1)
摘要:《个人信息保护法》8月20日通过,11月1日开始实施,app随意爬取用户信息的日子到头了 阅读全文
posted @ 2021-08-26 02:15 AKA栗子 阅读(120) 评论(0) 推荐(0)
摘要:一、变量分箱 变量分箱常见于逻辑回归评分卡的制作中,在入模前,需要对原始变量值通过分箱映射成woe值。举例来说,如“年龄”这一变量,我们需要找到合适的切分点,将连续的年龄打散到不同的”箱“中,并按年龄落入的“箱”对变量进行编码。 关于变量分箱的作用,相关资料中的解释有很多,我认为变量分箱最主要有三个 阅读全文
posted @ 2021-08-19 21:56 AKA栗子 阅读(7219) 评论(1) 推荐(1)