距离度量 —— 标准化欧氏距离 (Standardized EuclideanDistance)

Python学习系列文章👉 目录 👈

在这里插入图片描述

一、概述

前面我们提到了 欧式距离,而这里提到的 标准化欧氏距离 (Standardized EuclideanDistance) 是针对 欧式距离 的一种改进。

标准化欧式距离(Standardized EuclideanDistance)主要针对变量 x x x 进行了修改。使其变成了标准化变量。

二、计算公式

数据各维分量的分布不一样,那就先将各个分量都“标准化”到均值、方差等。
假设样本集 X X X均值 (mean) m m m标准差 (standard deviation) s s s,那么 X X X标准化变量 为:
X ∗ = X − m s X^*=\frac{X-m}{s} X=sXm

带入欧式距离公式得: d 12 = ∑ k = 1 n ( x 1 k − x 2 k s k ) 2 d_{12}=\sqrt{\sum_{k=1}^n(\frac{x_{1k}-x_{2k}}{s_{k}})^2} d12=k=1n(skx1kx2k)2

便得到了上面的 标准化欧式距离 公式。

在这里插入图片描述

posted @ 2022-06-20 17:27  繁依Fanyi  阅读(54)  评论(0)    收藏  举报  来源