摘要:
熵 $H = -\sum_{i = 1}^{n} p(x_{i}) \log p(x_{i})$ $n$ 是分类的数目,熵越大代表随机变量 $X$ 的不确定性越大。 可知 $0 \leqslant H(P) \leqslant \log n$ 条件熵 $H(Y|X)$ 表示已知随机变量 $X$ 的条 阅读全文
posted @ 2022-09-04 22:41
guangheli
阅读(74)
评论(0)
推荐(0)
摘要:
参考:《统计学习方法》 相似度与距离 对于聚类算法来说,定义相似度与距离是十分关键的。 Minkowski distance 设 $x_{i},x_{j}$ 是样本集合 $X$ 中的样本,$m$ 为特征数量,满足 $x_{i}=(x_{1i},x_{2i},....x_{mi})^T$ 则 $x_{ 阅读全文
posted @ 2022-09-04 19:45
guangheli
阅读(155)
评论(0)
推荐(0)