为什么要标准化？归一化？

核心结论是：标准化和归一化的核心目的是消除数据量纲差异、优化模型训练，二者适配不同数据场景和模型需求。

为什么需要标准化？

消除量纲影响，让不同单位的数据可对比。比如“身高（厘米）”和“体重（千克）”，标准化后能在同一尺度下参与计算。
避免模型受数据范围影响。像线性回归、SVM等依赖距离或梯度下降的模型，会因量纲差异偏向范围大的特征。
保留数据原始分布特征，对异常值鲁棒性更强，适合数据近似正态分布的场景。

为什么需要归一化？

压缩数据到固定区间，满足模型输入要求。比如神经网络激活函数（如Sigmoid）对输入范围敏感，归一化能避免梯度消失。
提升模型收敛速度。KNN、K-Means等基于距离计算的模型，归一化后能让梯度下降更平稳快速。
增强数据稳定性，适合数据分布不规则、没有明显 outliers 的场景。

要不要我帮你整理一份标准化与归一化选型对照表，明确适用场景、模型匹配和操作注意事项？

posted @ 2025-11-11 16:29 姚春辉阅读(51) 评论(0) 收藏举报

刷新页面返回顶部