摘要: 我们都知道,一般在机器学习任务当中,对于数据我们一般都要进行预处理,其中最有名的应该就是标准化了。还有归一化。首先我们先理清什么是归一化(normalization),什么是标准化(standardization) 什么是归一化、标准化? 归一化(normalization):$\frac{X_{i 阅读全文
posted @ 2021-02-08 23:26 木头人555 阅读(167) 评论(0) 推荐(0)
摘要: 问题描述:Kaggle比赛练手中的titanic问题中,当使用随机森林来填充损失的数据时,只判断了其中需要补充的一列的数据是否存在null,对于其他数据没有判断导致出现了: 分析原因后,所需要做的是判断numpy ndarry数组中是否存在NaN, infinity或者 数据太大导致溢出,我们在这里 阅读全文
posted @ 2021-01-08 13:11 木头人555 阅读(54) 评论(0) 推荐(0)