摘要: 皮尔森相关系数(Pearson Correlation Coefficient) 先讲几个统计学中一些基本的数学概念: 数学期望就是平均值: 均值公式: 方差: 或者: 另一种形式: 标准差: 标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准 阅读全文
posted @ 2018-08-29 17:52 不急不躁淡如水 阅读(18793) 评论(0) 推荐(1) 编辑
摘要: 杰卡德相似系数(Jaccardsimilarity coefficient) 两个集合A和B交集元素的个数在A、B并集中所占的比例,称为这两个集合的杰卡德系数,用符号 J(A,B) 表示。杰卡德相似系数是衡量两个集合相似度的一种指标(余弦距离也可以用来衡量两个集合的相似度)。 jaccard值越大说 阅读全文
posted @ 2018-08-29 16:07 不急不躁淡如水 阅读(5967) 评论(0) 推荐(0) 编辑
摘要: 向量余弦相似度 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性"。 上图两个向量a,b的夹角很小可以说a向量和b向量有很高的的相似性,极端情 阅读全文
posted @ 2018-08-29 14:03 不急不躁淡如水 阅读(7210) 评论(0) 推荐(0) 编辑