推荐系统“特征”的理解
推荐系统“特征”的理解
正排矩阵
每行表示一个用户,每列表示一个属性
| 用户ID | 年龄 | 性别 | 视频1偏好度 | 视频2偏好度 | 视频3偏好度 | ... |
|---|---|---|---|---|---|---|
| User1 | 25 | 男 | 0.8 | 0.1 | 0.6 | ... |
| User2 | 32 | 女 | 0.3 | 0.7 | 0.2 | ... |
| User3 | 40 | 男 | 0.4 | 0.5 | 0.9 | ... |
u侧特征
对于一个u侧特征,每个用户有其独有的值
正排矩阵的一列可以抽成一个u侧特征
特征示例:
- 用户年龄:28岁
- 用户性别:女
- 历史观看记录:主要观看科幻电影和纪录片
- 最近观看的视频类型:科幻电影
group侧特征
一个group就是一个视频
g侧特征,对于不同的视频值不一样,对于所有用户都是一样的
特征示例:
- 视频id,作者id
- 播放次数
- 点赞数
cross特征
把用户(u侧)和视频(g侧)混合计算得到的一种特征
推荐流程(大致)
- 特征整合:
- 将用户侧特征和群组侧特征整合在一起,比如g侧放到正排矩阵作为一个个额外列,一列数据一样。g侧虽然对每个用户一样,但和u侧融合后有attention价值,反之u对g的影响也是(我猜的)。
- 模型输入:
- 将这个整合后的特征向量输入推荐模型。这个模型可能是一个基于机器学习的算法,如协同过滤、内容基推荐或深度学习模型。
- 推荐计算:
- 推荐模型分析这个用户的特征向量,与数据库中的视频特征进行比对,输出6条推荐视频。
- 实际计算根据召回、粗排、精排会用不同的模型和策略

浙公网安备 33010602011771号