• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
chenqianguan
博客园 首页 新随笔 联系 订阅 订阅 管理

随笔分类 -  算法模型理论知识

 
假设检验
摘要:![](https://img2024.cnblogs.com/blog/3264920/202403/3264920-20240328110518485-1255276391.jpg) 阅读全文
posted @ 2024-03-28 11:05 广爷天下无双 阅读(7) 评论(0) 推荐(0)
woe、iv、ks的计算和定义
摘要:https://www.cnblogs.com/wqbin/p/10547628.html WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种编码形式。 要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(也叫离散化、分箱等等,说的都是一个意思)。 阅读全文
posted @ 2024-03-20 19:55 广爷天下无双 阅读(357) 评论(0) 推荐(0)
决策树原理加例子
摘要:网站 1:https://zhuanlan.zhihu.com/p/197476119 #综合 2:https://blog.csdn.net/u010916338/article/details/94653402 #信息增益率 3:https://zhuanlan.zhihu.com/p/4932 阅读全文
posted @ 2024-01-07 15:34 广爷天下无双 阅读(38) 评论(0) 推荐(0)
一些风控知识
摘要:切比雪夫大数定理 所有数据中,至少有3/4(或75%)的数据位于平均数2个标准差范围内。 所有数据中,至少有8/9(或88.9%)的数据位于平均数3个标准差范围内。 所有数据中,至少有24/25(或96%)的数据位于平均数5个标准差范围内 协方差和相关系数的关系与区别 协方差: 协方差表示的是两个变 阅读全文
posted @ 2023-12-11 19:01 广爷天下无双 阅读(26) 评论(0) 推荐(0)
模型理论知识
摘要:人工智能:机器学习、对环境的感知、实现动作 机器学习 学习: 2.机器学习三要素:数据、算法、模型 机器学习研究的是从数据中通过选取合适的算法,自动的归纳逻辑或规则,并根据这个归纳的结果(模型)与新数据来进行预测。 3.深度学习是在机器学习的基础上实现的,得益于机器性能的提升。神经网络则是深度学习的 阅读全文
posted @ 2023-12-11 18:59 广爷天下无双 阅读(98) 评论(0) 推荐(0)
模型评价指标
摘要:准确率、召回率 网址 :https://blog.csdn.net/seagal890/article/details/105059498 True Positive(TP):真正类。样本的真实类别是正类,并且模型识别的结果也是正类。 False Negative(FN):假负类。样本的真实类别是正 阅读全文
posted @ 2023-12-09 19:38 广爷天下无双 阅读(213) 评论(0) 推荐(0)
逻辑回归思路
摘要:整体建模思路 1、拿到样本先分训练集和测试集,0.7或0.8,根据样本数量考虑是否增加验证集,本次不增加验证集。 2、对训练集样本进行初筛。iv大于0.01,相关系数低于80%,缺失率根据变量中文名无特殊情况,不得高于80%。 3、对训练集先用决策树分6-8箱。此时对变量进行二次筛选。主要考虑变量是 阅读全文
posted @ 2023-12-09 14:36 广爷天下无双 阅读(18) 评论(0) 推荐(0)
XGB调参思路
摘要:(1)选择较高的学习率,例如learning_rate=0.1,这样可以减少迭代用时。 (2)然后对 (max_depth , min_child_weight) , (3)在第二步确定的基础上调整 gamma , (4)subsample, colsample_bytree 这些参数进行调整。 ( 阅读全文
posted @ 2023-12-09 14:33 广爷天下无双 阅读(149) 评论(0) 推荐(0)
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3