聚类评价指标(Clustering Metrics)

-兰德系数(Rand Index)

a: 在C和K中都分为同类的样本对的数量;

b: 在C和K中都分为不同类的样本对的数量;

分母: 所有的样本对数量. 其中n为样本空间的大小.

$ \frac{a+b}{C_{n}^2}$

 

-正则化熵 (Normalized Entropy, NE)

  • NE等于预测的log loss除以background CTR的熵

 

-互信息 (Mutual Information, MI)

 

posted @ 2021-07-20 15:58  Raylan  阅读(502)  评论(0)    收藏  举报