随笔分类 - 机器学习
摘要:杰卡德相似系数(Jaccardsimilarity coefficient) 两个集合A和B交集元素的个数在A、B并集中所占的比例,称为这两个集合的杰卡德系数,用符号 J(A,B) 表示。杰卡德相似系数是衡量两个集合相似度的一种指标(余弦距离也可以用来衡量两个集合的相似度)。 jaccard值越大说
阅读全文
posted @ 2018-08-29 16:07
不急不躁淡如水
摘要:向量余弦相似度 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性"。 上图两个向量a,b的夹角很小可以说a向量和b向量有很高的的相似性,极端情
阅读全文
posted @ 2018-08-29 14:03
不急不躁淡如水

浙公网安备 33010602011771号