距离与聚类

TBtool热图相关选项

距离(distance):pearsonDist、pearsonCor、Euclidean

聚类(cluster):Single-linkage、Complete-linkage、Group average、median

Hierarchical clustering

https://blog.csdn.net/loveliuzz/article/details/78057197

https://blog.csdn.net/andy_shenzl/article/details/83783469

https://blog.csdn.net/M1M1M16/article/details/79415871

https://www.cnblogs.com/always-fight/p/9375099.html

https://cloud.tencent.com/developer/article/1477031

http://blog.sciencenet.cn/blog-651374-988817.html

 

r语言中使用hclust(d,method = "complete", members=NULL) :进行层次聚类。d为距离矩阵;method表示类的合并方法,single最短距离法,complete最长距离法,median中间距离法,mcquitty 相似法,average 类平均法,centroid重心法,ward离差平方和法;members为NULL或d长度的矢量。

hc1=hclust(d,"single");

hc2=hclust(d,"complete");

hc3=hclust(d,"median");

hc4=hclust(d,"average");

其中hclust表示系统聚类计算函数,single、complete、median、average分别表示最短距离法、最长距离法、中间距离法、类平均法这四种聚类方法。


层次聚类,基于指定的相似度或距离定义计算出类之间距离,再进行聚类

首先我们会计算距离矩阵(distance matrix),其中矩阵的元素(i,j)代表观测值 i 和 j 之间的距离度量。然后将最接近的两个观察值组为一对,并计算它们的平均值。通过将成对观察值合并成一个对象,我们生成一个新的距离矩阵。具体合并的过程即计算每一对最近观察值的均值,并填入新距离矩阵,直到所有观测值都已合并。(计算量很大。。。)

posted @ 2019-12-25 21:43  HISAK  阅读(642)  评论(0)    收藏  举报