上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 37 下一页
摘要: 借鉴学习链接 https://www.zhihu.com/column/exuding 零基础入门金融风控贷款违约模型 使用AI-stdio的16GGPU进行加速处理 TODO 待续 模型融合 代码如下: # # 如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例: # # If a p 阅读全文
posted @ 2020-09-27 20:17 山枫叶纷飞 阅读(488) 评论(0) 推荐(0) 编辑
摘要: 引用 特征工程中的「归一化」有什么作用? - 微调的回答 - 知乎 https://www.zhihu.com/question/20455227/answer/370658612 特征工程中的「归一化」有什么作用? - 忆臻的回答 - 知乎 https://www.zhihu.com/questi 阅读全文
posted @ 2020-09-27 16:38 山枫叶纷飞 阅读(595) 评论(0) 推荐(0) 编辑
摘要: 01 简单编写了一个暴力枚举找到一个分值更高的系数比 best = [0.5, 0.5] 提交结果为每个测试样本是1的概率,也就是y为1的概率。评价方法为AUC评估模型效果(越大越好)。 best_auc = 0 best = [0.5 , 0.5] for i in range(0, 101, 1 阅读全文
posted @ 2020-09-24 23:52 山枫叶纷飞 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 强烈先全部看一遍各种报错原因,先全文浏览一遍,坑比较多~~ pandas_profiling安装的各种问题记录 常见如下: MemoryError... MemoryError: Unable to allocate 201. MiB for an array with shape (33, 800 阅读全文
posted @ 2020-09-22 22:13 山枫叶纷飞 阅读(1565) 评论(0) 推荐(0) 编辑
摘要: md 零基础入门金融风控-贷款违约预测 Task03 特征工程 Task03目的: 学习特征预处理/缺失值处理/异常值处理/数据分桶等特征处理方法 学习特征交互/特征编码/特征选择的相应方法 0.0 导包 import pandas as pd import numpy as np import m 阅读全文
posted @ 2020-09-21 23:50 山枫叶纷飞 阅读(615) 评论(0) 推荐(0) 编辑
摘要: 代码 #%% 2.2.0 分块读取示例 (适用于文件特别大的场景) # a. 通过nrows参数, 来设置读取文件的前多少行, data_train_sample = pd.read_csv(testA_file_path, nrows=5) #b. 分块读取 #设置chunksize参数,来控制每 阅读全文
posted @ 2020-09-21 17:00 山枫叶纷飞 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 贷款违约预测-赛题理解&基线预测 天池鱼佬直播 原网址: https://tianchi.aliyun.com/course/video?liveId=41203 下载地址: https://tianchi-media.oss-cn-beijing.aliyuncs.com/online-video 阅读全文
posted @ 2020-09-20 11:42 山枫叶纷飞 阅读(618) 评论(0) 推荐(0) 编辑
摘要: 零基础入门金融风控-贷款违约预测 Task02 探索性数据分析 Task02目的: 熟悉整体数据集的基本情况,异常值,缺失值等, 判断数据集是否可以进行接下来的机器学习或者深度学习建模. 了解变量间的项目关系/变量与预测值之间的存在关系 为特征工程作准备 准备数据 import os import 阅读全文
posted @ 2020-09-18 23:01 山枫叶纷飞 阅读(644) 评论(0) 推荐(0) 编辑
摘要: 零基础入门金融风控-贷款违约预测 Task01 参赛链接 https://tianchi.aliyun.com/competition/entrance/531830/information Task01 赛题理解 md 零基础入门金融风控-贷款违约预测 目的: 根据贷款申请人的数据信息预测其是否有 阅读全文
posted @ 2020-09-15 22:45 山枫叶纷飞 阅读(423) 评论(0) 推荐(0) 编辑
摘要: 2.1 经验误差与过拟合 错误率: E = a(错误数) / m(样本数) 精度 = 1 - 错误率 误差: 在训练集上的误差成为训练误差,在新样本上的误差成为泛化误差 NP问题: NP完全问题,即多项式复杂程度的非确定性问题。简单的写法是 NP=P?, 特征:求解困难程度远高于验证的困难程度,如素 阅读全文
posted @ 2020-09-13 23:05 山枫叶纷飞 阅读(272) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 37 下一页