随笔分类 -  数据挖掘,推荐算法

摘要:knn流程 数据读取 数据归一化 knn实现 数据分析 以数据的前两项特征对数据进行划分得到以下散点图: 具体实现 import numpy as np def read_data(path): lines=path.readlines() data=[] label=[] for line in 阅读全文
posted @ 2021-04-26 09:43 彭源 阅读(250) 评论(0) 推荐(0)
摘要:推荐系统的构成元素 物品集合 用户 场景 推荐引擎:根据用户对物品或者信息的偏好(包括用户对物品的评分、用户查看物品的记录、用户的购买记录等)与用户的画像数据进行拟合,学习得到什么样的用户会喜欢什么样的物品这样一个模型 推荐结果集 ##推荐引擎构成: 召回模块:根据用户和场景特征,从物品列表(上百万 阅读全文
posted @ 2020-10-07 17:12 彭源 阅读(201) 评论(0) 推荐(0)
摘要:余弦相似度 在数据挖掘中的实际利用公式为: 其中令N(u)表示用户u曾经有过正反馈的物品集合,令N(v)为用户v曾经有过正反馈的物品集合。 例如: 上图分别为用户A,B,C,D的有过行为的物品,则求A,B的余弦相似度计算过程为: A=(1,1,0,1,0);B=(1,0,1,0,0) 则 阅读全文
posted @ 2020-10-07 15:45 彭源 阅读(243) 评论(0) 推荐(0)