摘要: 余弦相似度精度问题引起的偏差 余弦相似度值不等于1(实际是等于1) 两个向量$a$和$b$是相同的,余弦相似度值应该是1,但是通过sklearn和numpy计算的结果却不等于1,会出现大于1或者小于1的情况,实际上余弦值应该是在[-1, 1]这个区间内的。 使用sklearn.metrics.pai 阅读全文
posted @ 2023-05-17 17:20 三叶草body 阅读(926) 评论(0) 推荐(0)
摘要: sklearn之主成分分析pca 在scikit-learn中,CA是主成分分析的缩写。主成分分析是一种常用的线性降维技术,可以将多维数据集降到较低的特征维度,并保留数据集的大部分特征信息。在sklearn中,使用PCA需要引入PCA模块,并通过实例化一个PCA对象来使用它的方法和属性。例如,可以使 阅读全文
posted @ 2023-05-17 12:10 三叶草body 阅读(220) 评论(0) 推荐(0)
摘要: 余弦相似性 介绍 余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。 cosine_similarity是一种度量两个非零向量之间夹角的相似性的方法。它的计算方法如下: $cosine_similarit 阅读全文
posted @ 2023-05-17 11:36 三叶草body 阅读(682) 评论(0) 推荐(0)