图书推荐系统-----基于用户的协同过滤算法调研

　　使用xmind整理了一下基于用户的协同过滤算法的整体流程

　　计算两个用户之间的相似度

　　主要利用行为的相似度计算兴趣的相似度。

　　　　给定用户u和用户v两个用户，N(u)表示用户u曾经有过正反馈的物品集合，N(v)表示用户v曾经有过正反馈的物品集合，有三种方法来计算相似度。

　　　　余弦相似度

　　　　皮尔逊相似度

　　　　Jaccard公式

　　　　经过查阅相关资料，利用皮尔逊相似度来计算用户间的相似度学校过比较理想。

　　　　皮尔逊相似度：要理解皮尔逊相似度首先要理解协方差，协方差是反映两个随机变量相关程度的指标，如果一个变量随着另一个变量同时变大或变小，那么两个变量的协方差就是正值，反之相反。公式如下：

　　　　　　皮尔逊相关系数如下：

　　为了更好地度量两个随机变量的相关程度，引入了皮尔逊相关系数，其在协方差基础上除以了两个随机变量的标准差，容易得出，皮尔逊相关系数是介于-1到1之间的值，当两个变量的线性关系增强时，相关系数趋于-1或1；当一个变量增大时，另一个变量也跟着增大，说明它们之间是正相关的，相关系数大于0,；若一个变量增大，另一个变量

减小，说明它们之间是负相关的，相关系数小于0；相关系数等于0说明它们之间不存在线性相关关系。

计算方法举例

　　比如有如下用户-商品矩阵