05 2020 档案
摘要:模型的先验概率:在不考虑数据的前提下,模型本身得到有效结果的概率。 复杂模型对变量之间的关系做出了许多设定,相比于简单模型,总的来说天然地难以满足,也就是先验概率低。 什么是正则化 正则化是结构风险最小化策略的实现,在经验风险上加一个正则项或罚项,正则项一共有两种L1正则化和L2正则化,或者L1范数
阅读全文
摘要:模型建模与问题解决流程: 数据处理 特征工程 模型选择 寻找最佳超参数:交叉验证 模型分析与融合 模型融合: 过拟合:bagging 不使用全部数据集,每次选取一个子集训练模型。这样就得到了多个模型(例如 有一个1:10的正负样本 分成10个1:1的正负样本) 分类:用这些模型的结果做vote 回归
阅读全文
摘要:数据填充 https://blog.csdn.net/weixin_39549734/article/details/81221276 test[col].mode() 求出这一列的众数(出现次数最多的数) test[col].fillna(value=test[col].mode()[0] ,in
阅读全文
摘要:该函数主要用于滤除缺失数据。 如果是Series,则返回一个仅含非空数据和索引值的Series,默认丢弃含有缺失值的行。 xx.dropna() 对于DataFrame: data.dropna(how = 'all') # 传入这个参数后将只丢弃全为缺失值的那些行data.dropna(axis
阅读全文
摘要:简单的神经网络: 一个神经网络,其中包含一个输入节点、一个输出节点,以及两个隐藏层(分别有两个节点)。相邻的层中的节点通过权重 𝑤𝑖𝑗wij 相关联,这些权重是网络参数 每个节点都有一个总输入 𝑥、一个激活函数 𝑓(𝑥)以及一个输出 𝑦=𝑓(𝑥)。 𝑓(𝑥)必须是非线性函数,否
阅读全文

浙公网安备 33010602011771号