09 2020 档案
摘要:voting简单投票 优点: 速度快 train_for_model = pd.read_csv('train_for_model.csv') testa_for_model = pd.read_csv('testa_for_model.csv') train_for_model.drop(colu
阅读全文
摘要:建模 使用随机森林加网络搜索调参,调节5个参数:n_estimators max_depth min_samples_split min_samples_leaf max_features 第一种: 单个参数调参 第二种: 5个参数一起调参 想法:想看看哪种方法结果好些 几十w数据这样调参时间相当久
阅读全文
摘要:import pandas as pd import numpy as np import warnings warnings.filterwarnings('ignore') import matplotlib.pyplot as plt import seaborn as sns train =
阅读全文
摘要:查看train与test列特征 train 800000条数据,47列; testa 200000条数据,48列。 >>>print(train.shape) >>>print(testa.shape) (800000, 47) (200000, 48) testa数据集存在n2.2, n2.3,
阅读全文
摘要:赛题数据 赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitl
阅读全文
浙公网安备 33010602011771号