2021年2月25日
摘要: 建模tips 1.数值型特征分箱有什么用处? 数值型特征本是可以直接入模的,但往往风控人员要对其做分箱,转化为WOE编码进而做标准评分卡等操作。从模型效果上来看,特征分箱主要是为了降低变量的复杂性,减少变量噪音对模型的影响,提高自变量和因变量的相关度。从而使模型更加稳定。 特征分箱的目的: 从模型效 阅读全文
posted @ 2021-02-25 20:03 小小喽啰 阅读(364) 评论(0) 推荐(0)
摘要: 之前讲原理的时候就说到算法受随机参数影响比价大且所占内存和时间非常大,因此我们需要用到网格搜索法,且需要时间以及耐心等待 对于里面参数不了解的话,可以去网站:https://catboost.ai/docs/concepts/python-reference_catboostclassifier_f 阅读全文
posted @ 2021-02-25 17:47 小小喽啰 阅读(403) 评论(0) 推荐(0)
摘要: 每学习一种算法,我们都要带着问题去学习 1.算法原理是什么? 2.损失函数是什么? 3.优势劣势是什么? 4.算法适用场景,使用之前对数据的要求是什么?类别型变量是否可用? 一、catboost算法原理 CatBoost是俄罗斯的搜索巨头Yandex在2017年开源的机器学习库,是Boosting族 阅读全文
posted @ 2021-02-25 16:53 小小喽啰 阅读(8086) 评论(0) 推荐(2)
摘要: 一、二分类代码模板 二分类也就是我们平时的0和1二类,和逻辑回归的label一样 import lightgbm as lgb import pandas as pd import numpy as np import pickle from sklearn.metrics import roc_a 阅读全文
posted @ 2021-02-25 15:21 小小喽啰 阅读(451) 评论(0) 推荐(0)
摘要: 先上官网链接:https://lightgbm.readthedocs.io/en/latest/ 接着带着问题去学习LGB: 1.LGB算法原理是什么 2.LGB应用场景是什么?或者说要求数据类型是什么 3.参数,调参之类的? 一、LGB原理 LightGBM (Light Gradient Bo 阅读全文
posted @ 2021-02-25 11:38 小小喽啰 阅读(2053) 评论(0) 推荐(0)