上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 36 下一页
摘要: 一、介绍 scikit-learn 包含各种随机样本的生成器,可以用来建立可控制大小和复杂性的人工数据集。 make_blob() —— 聚类生成器 make_classification() —— 单标签分类生成器 make_multilabel_classification() —— 多标签生成 阅读全文
posted @ 2022-03-08 00:20 Hider1214 阅读(3578) 评论(0) 推荐(2) 编辑
摘要: 一、业务背景 日常工作、比赛的分类问题中常遇到类别型的因变量存在严重的偏倚,即类别之间的比例严重失调。 样本量差距过大会导致建模效果偏差。 例如逻辑回归不适合处理类别不平衡问题,会倾向于将样本判定为大多数类别,虽然能达到很高的准确率,但是很低的召回率。 出现样本不均衡场景主要有: 异常检测:恶意刷单 阅读全文
posted @ 2022-03-07 16:47 Hider1214 阅读(8136) 评论(0) 推荐(0) 编辑
摘要: 一、挑战 你的面前有三个大门(A/B/C),其中有一个门背后有5000万的大奖,猜对了就归你!在你做出选择之后(假设选择A),会从剩下的两个门中打开一个没有大奖的门(例如:B),然后问你是否改变最初的选择? —— “坚持你的选择!坚持你的选择!” —— 不会就蒙C! —— 《恐怖游轮》不断重复循环 阅读全文
posted @ 2022-03-04 16:36 Hider1214 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 最近在打 2022 DCIC 比赛 —— 能源大数据子赛道:虚拟货币挖矿行为识别。 遂对模型融合学习一番。 以此记录。 一、原理 略 二、实操 1.准备数据 ## 数据准备 from sklearn.datasets import make_classification from sklearn.m 阅读全文
posted @ 2022-03-01 23:55 Hider1214 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 一、交叉验证 机器学习中常用交叉验证函数:KFold 和 StratifiedKFold。 方法导入: from sklearn.model_selection import KFold, StratifiedKFold StratifiedKFold:采用分层划分的方法(分层随机抽样思想),验证集 阅读全文
posted @ 2022-03-01 00:08 Hider1214 阅读(1542) 评论(0) 推荐(0) 编辑
摘要: 一、总体 一般通过偏度和峰度对数据分布形态进行分析,与正态分布进行比较。 正态分布的偏度和峰度都看做零。 实际分析中,如果遇到峰度、偏度不为零情况,即表明变量存在左偏右偏,或者高顶平顶一说。 二、偏度 skewness 1.介绍 偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数 阅读全文
posted @ 2022-02-28 22:25 Hider1214 阅读(2373) 评论(0) 推荐(0) 编辑
摘要: 一、%占位符 1.说明 # 符号代表意义 %s -- 字符串 %10s -- 指定长度 左填充 %-10s -- 指定长度 右填充 %f -- 浮点数 %.2f -- 保留2位小数点 %d -- 整数 2.实操 a = 'Name' b = 'Hider' c = 100 d = 1.80 prin 阅读全文
posted @ 2022-02-03 21:12 Hider1214 阅读(798) 评论(0) 推荐(0) 编辑
摘要: 一、背景 给定一个维表,如下: 区域 编码范围 N0 1000-1935, 2000-2079, 2085-2107 GF 2250-2263 WG 2500-2507, 2515-2532 NC 2282-2310 BR 3350, 3353-3356 V2 2648, 2715, 2717-27 阅读全文
posted @ 2022-01-28 16:34 Hider1214 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 一、需求 现有一个维表,包含以下字段: 国家 货物类型 重量上限2 重量下限2 运费 挂号费 ''' 英国 普货类 0 2 61 16 英国 普货类 2 20 61 16 英国 内置电池 0 2 83 16 英国 内置电池 2 20 78 16 德国 普货类 0 0.4 63 18 德国 普货类 0 阅读全文
posted @ 2022-01-28 10:19 Hider1214 阅读(980) 评论(0) 推荐(0) 编辑
摘要: 人到中年 上有老 下有小 无时无刻不在焦虑 前几日刚迈入人生三十的大关卡 接下来将面对人生更大的挑战 也将面临更多的十字路口 踏错一步 将。。 今日焦躁。。 无输出。 阅读全文
posted @ 2022-01-18 23:33 Hider1214 阅读(58) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 36 下一页