为什么要标准化?归一化?
核心结论是:标准化和归一化的核心目的是消除数据量纲差异、优化模型训练,二者适配不同数据场景和模型需求。
为什么需要标准化?
- 消除量纲影响,让不同单位的数据可对比。比如“身高(厘米)”和“体重(千克)”,标准化后能在同一尺度下参与计算。
- 避免模型受数据范围影响。像线性回归、SVM等依赖距离或梯度下降的模型,会因量纲差异偏向范围大的特征。
- 保留数据原始分布特征,对异常值鲁棒性更强,适合数据近似正态分布的场景。
为什么需要归一化?
- 压缩数据到固定区间,满足模型输入要求。比如神经网络激活函数(如Sigmoid)对输入范围敏感,归一化能避免梯度消失。
- 提升模型收敛速度。KNN、K-Means等基于距离计算的模型,归一化后能让梯度下降更平稳快速。
- 增强数据稳定性,适合数据分布不规则、没有明显 outliers 的场景。
要不要我帮你整理一份标准化与归一化选型对照表,明确适用场景、模型匹配和操作注意事项?

浙公网安备 33010602011771号