会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Hider1214
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
···
36
下一页
2022年3月8日
机器学习笔记:sklearn.datasets样本生成器——make_classification、make_blobs、make_regression
摘要: 一、介绍 scikit-learn 包含各种随机样本的生成器,可以用来建立可控制大小和复杂性的人工数据集。 make_blob() —— 聚类生成器 make_classification() —— 单标签分类生成器 make_multilabel_classification() —— 多标签生成
阅读全文
posted @ 2022-03-08 00:20 Hider1214
阅读(5042)
评论(0)
推荐(2)
2022年3月7日
机器学习笔记:imblearn之SMOTE算法处理样本类别不平衡
摘要: 一、业务背景 日常工作、比赛的分类问题中常遇到类别型的因变量存在严重的偏倚,即类别之间的比例严重失调。 样本量差距过大会导致建模效果偏差。 例如逻辑回归不适合处理类别不平衡问题,会倾向于将样本判定为大多数类别,虽然能达到很高的准确率,但是很低的召回率。 出现样本不均衡场景主要有: 异常检测:恶意刷单
阅读全文
posted @ 2022-03-07 16:47 Hider1214
阅读(11471)
评论(0)
推荐(0)
2022年3月4日
有趣智力题:蒙提霍尔悖论 —— “决定”挑战
摘要: 一、挑战 你的面前有三个大门(A/B/C),其中有一个门背后有5000万的大奖,猜对了就归你!在你做出选择之后(假设选择A),会从剩下的两个门中打开一个没有大奖的门(例如:B),然后问你是否改变最初的选择? —— “坚持你的选择!坚持你的选择!” —— 不会就蒙C! —— 《恐怖游轮》不断重复循环
阅读全文
posted @ 2022-03-04 16:36 Hider1214
阅读(316)
评论(0)
推荐(0)
2022年3月1日
机器学习笔记:模型融合之stacking
摘要: 最近在打 2022 DCIC 比赛 —— 能源大数据子赛道:虚拟货币挖矿行为识别。 遂对模型融合学习一番。 以此记录。 一、原理 略 二、实操 1.准备数据 ## 数据准备 from sklearn.datasets import make_classification from sklearn.m
阅读全文
posted @ 2022-03-01 23:55 Hider1214
阅读(581)
评论(0)
推荐(0)
机器学习笔记:sklearn交叉验证之KFold与StratifiedKFold
摘要: 一、交叉验证 机器学习中常用交叉验证函数:KFold 和 StratifiedKFold。 方法导入: from sklearn.model_selection import KFold, StratifiedKFold StratifiedKFold:采用分层划分的方法(分层随机抽样思想),验证集
阅读全文
posted @ 2022-03-01 00:08 Hider1214
阅读(2225)
评论(0)
推荐(0)
2022年2月28日
机器学习笔记:偏度skew与峰度kurt
摘要: 一、总体 一般通过偏度和峰度对数据分布形态进行分析,与正态分布进行比较。 正态分布的偏度和峰度都看做零。 实际分析中,如果遇到峰度、偏度不为零情况,即表明变量存在左偏右偏,或者高顶平顶一说。 二、偏度 skewness 1.介绍 偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数
阅读全文
posted @ 2022-02-28 22:25 Hider1214
阅读(3181)
评论(0)
推荐(0)
2022年2月3日
Python学习笔记:格式化输出之f-string、format、%
摘要: 一、%占位符 1.说明 # 符号代表意义 %s -- 字符串 %10s -- 指定长度 左填充 %-10s -- 指定长度 右填充 %f -- 浮点数 %.2f -- 保留2位小数点 %d -- 整数 2.实操 a = 'Name' b = 'Hider' c = 100 d = 1.80 prin
阅读全文
posted @ 2022-02-03 21:12 Hider1214
阅读(1221)
评论(0)
推荐(0)
2022年1月28日
Python学习笔记:给定邮编,判断区域
摘要: 一、背景 给定一个维表,如下: 区域 编码范围 N0 1000-1935, 2000-2079, 2085-2107 GF 2250-2263 WG 2500-2507, 2515-2532 NC 2282-2310 BR 3350, 3353-3356 V2 2648, 2715, 2717-27
阅读全文
posted @ 2022-01-28 16:34 Hider1214
阅读(390)
评论(0)
推荐(0)
Python学习笔记:快递运费计算
摘要: 一、需求 现有一个维表,包含以下字段: 国家 货物类型 重量上限2 重量下限2 运费 挂号费 ''' 英国 普货类 0 2 61 16 英国 普货类 2 20 61 16 英国 内置电池 0 2 83 16 英国 内置电池 2 20 78 16 德国 普货类 0 0.4 63 18 德国 普货类 0
阅读全文
posted @ 2022-01-28 10:19 Hider1214
阅读(1181)
评论(0)
推荐(0)
2022年1月18日
深夜有感
摘要: 人到中年 上有老 下有小 无时无刻不在焦虑 前几日刚迈入人生三十的大关卡 接下来将面对人生更大的挑战 也将面临更多的十字路口 踏错一步 将。。 今日焦躁。。 无输出。
阅读全文
posted @ 2022-01-18 23:33 Hider1214
阅读(70)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
11
···
36
下一页
公告