摘要: 一、针对连续值的分桶 def GreedyFindBin(distinct_values, counts,num_distinct_values, max_bin, total_cnt, min_data_in_bin=3): #INPUT: # distinct_values 保存特征取值的数组, 阅读全文
posted @ 2022-11-18 17:35 光彩照人 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 信贷风险管理是一门艺术,更是一门科学。资产质量分析中常会涉及到三个理论: 账龄分析(Vintage Analysis):用以分析账户成熟期、变化规律等。 滚动率分析(Roll Rate Analysis):用以定义账户好坏程度。 迁移率分析(Flow Rate Analysis):用以分析不同逾期状 阅读全文
posted @ 2022-09-09 15:26 光彩照人 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 来源:风险监测指标体系大全(信审类、反欺诈类、催收类、资产质量类) 从技术实现方式来看,我们先将指标分为四类:基础指标、衍生指标、趋势指标、核心指标。 1.基础指标:基于风险数据集市简单加工的一些指标,多以绝对量指标为主,通常在风险数据集市基层中实现。例如申请客户数、授信通过客户数、放款金额、贷款余 阅读全文
posted @ 2022-08-11 09:52 光彩照人 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 一、无水印将图片合并成pdf输出 步骤: 1.用手机拍照或者扫描王APP扫描成图片 2.按1、2、3等顺序为图片重新命名 3.执行下列代码合并成pdf from PIL import Image import os def change_img_size(size,im_pth): im = Ima 阅读全文
posted @ 2022-07-24 08:54 光彩照人 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 一、概念理解 图网络,即Natural Graph,是基于世界各实体之间的自然关系表示而得到的图,他们的节点一般是某个特定网络中的实体(人、物理机、分子)。例如:社交网络、通信网络、蛋白质网络。 知识图谱,即Knowledge Graph,它一般是由知识或信息组织而成的图,它是专门被用来构建知识库并 阅读全文
posted @ 2022-07-19 14:41 光彩照人 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 一、woe是什么? WOE,全称是“Weight of Evidence”,翻译过来就是证据权重,是对于字符型变量的某个值或者是连续变量的某个分段下的好坏客户的比例的对数。实际的应用会将原始变量对应的数据替换为应用WOE公式后的数据,也称作WOE编码或者WOE化。 WOE编码需要首先将这个变量分组处 阅读全文
posted @ 2022-07-13 09:32 光彩照人 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 一、transformer的架构图 主要分为两大块,Encoders和Decoders,两块分别由6个Encoder和Decoder组成。其实Encoders的功能就是抽取特征的,抽取出来的特征就交给Decoders,Decoders用Encoders抽取到的特征去做具体的任务,类比到常见的机器学习 阅读全文
posted @ 2022-06-14 21:07 光彩照人 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 一、softmax函数公式 softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类。假设我们有一个数组Z,Zi表示Z中的第i个元素,那么这个元素的softmax值就是如下: Softmax函数可以将上一层的原始数据进行归一化,转化为一个【0 阅读全文
posted @ 2022-06-06 07:53 光彩照人 阅读(1974) 评论(0) 推荐(0) 编辑
摘要: 一、什么是图灵机? 图灵机(Turing machine),是艾伦・麦席森・图灵(1912-1954年)于1936年提出的一种抽象的计算模型,即将人们使用纸笔进行数学运算的过程进行抽象,由一个虚拟的机器替代人类进行复杂的数学运算。它有一条无限长的纸带,纸带分成了一个一个的小方格,每个方格有不同的颜色 阅读全文
posted @ 2022-05-28 08:21 光彩照人 阅读(739) 评论(0) 推荐(0) 编辑
摘要: 来源:https://mp.weixin.qq.com/s/ppmhg9BMwUEs-Fa1wNyiSA 阅读全文
posted @ 2022-04-14 11:09 光彩照人 阅读(26) 评论(0) 推荐(0) 编辑