基于多因素的搭配推荐模型

之所以起这个名字是因为对应之前的搭配推荐模型,如之前的博客 基于图像信息的搭配商品推荐 中所述,可以看做是基于单因素对搭配进行建模,即认为搭配的商品应该在单因素--风格上相似,然后在对商品映射后的latent space即风格空间中,搭配的商品的距离会更接近。

然后更进一步很自然的想法就是:

1)相互搭配的商品是可以在多个因素上近似的,比如款式、材质、印花、颜色等,而用风格这一个概念来概括就显得有些粗糙。

2)可以与一个主商品进行搭配的pair商品也可以是多种风格的,比如一件T恤可以跟不同风格的下装搭配,搭出运动、休闲、淑女等不同的风格。

基于这两种不同的思路,可以采用不同的两种方式进行建模。

1. Learning Compatibility Across Categories for Heterogeneous Item Recommendation

这篇paper提出一种方法:Mixtures of Non-Metric Embeddings for Recommendation, 简称Monomer,是为了对multiple localized notions of relatedness进行建模,即搭配的商品pair之间是可以有多种方面的因素的,而之前的搭配建模方式是只能学习到global notion of relatedness,这也是这种方法能够产出多样性搭配推荐结果的关键点。

建模方式:

1)Low-rank Mahalanobis Metric

将E看作是商品原始向量到latent space向量的映射关系,则映射后商品pair之间的距离是

2)Multiple, Non-Metric Embeddings

因为考虑到相互搭配的商品是可以在多个因素上近似的,比如款式、材质、印花、颜色等,而用风格这一个概念来概括就显得有些粗糙。所以可以有多个E,即用Ek来表示,每个Ek可以看作是一种特征提取的方式。其中第k种映射空间上,商品pair之间的距离为:

3)Probabilistic Mixtures of Embeddings

将N种映射方式上的预测距离加权求和,那么权重如何确定呢?考虑到非对称的设定,应该主要与主商品的特征相关。如下:

where U  is a newly-introduced F*N  parameter matrix with U:;k  being its k -th column.

最终,商品pair的距离为:

模型训练:

采用最大似然估计的方式计算loss并进行模型训练。

 

2. Compatibility Family Learning for Item Recommendation and Generation

这篇paper同样是基于多因素进行搭配关系的建模,但与上一篇paper不同的是,主要假设是:可以与一个主商品进行搭配的pair商品可以是多种风格的。

paper提出了一种end-to-end的模型,将每个item映射到latent space上的K+1的向量,其中1个向量代表该item,另外K个向量代表该item的K个compatible prototypes,这些prototypes反应了搭配建模中的多样性,即可以与一个主商品进行搭配的pair商品可以是多种风格的。这K+1个向量即是该item的 compatibility family。

建模方式:

1)Projected Compatibility Distance

PCD是用于衡量两个商品之间的搭配关系的。

每个item可以被E0映射为一个向量;另外还可以被Ek(k=1,2,...,K)映射为K个向量,每个向量都靠近与其搭配的商品所组成的cluster。PCD的计算方式如下:

用图来表示的话:

2)最大似然估计

Ek(k=1,2,...,K)的大多数网络层参数都是共享的,只有最后一层参数是独立训练的。

使用最大似然估计进行建模:

模型训练:

 

posted @ 2018-07-22 01:24  笨兔勿应  阅读(1389)  评论(0编辑  收藏  举报