基于多因素的搭配推荐模型

时间：2018-07-22 11:19:58 阅读：218 评论：0 收藏：0 [点我收藏+]

之所以起这个名字是因为对应之前的搭配推荐模型，如之前的博客基于图像信息的搭配商品推荐中所述，可以看做是基于单因素对搭配进行建模，即认为搭配的商品应该在单因素--风格上相似，然后在对商品映射后的latent space即风格空间中，搭配的商品的距离会更接近。

然后更进一步很自然的想法就是：

1）相互搭配的商品是可以在多个因素上近似的，比如款式、材质、印花、颜色等，而用风格这一个概念来概括就显得有些粗糙。

2）可以与一个主商品进行搭配的pair商品也可以是多种风格的，比如一件T恤可以跟不同风格的下装搭配，搭出运动、休闲、淑女等不同的风格。

基于这两种不同的思路，可以采用不同的两种方式进行建模。

1. Learning Compatibility Across Categories for Heterogeneous Item Recommendation

这篇paper提出一种方法：Mixtures of Non-Metric Embeddings for Recommendation, 简称Monomer，是为了对multiple localized notions of relatedness进行建模，即搭配的商品pair之间是可以有多种方面的因素的，而之前的搭配建模方式是只能学习到global notion of relatedness，这也是这种方法能够产出多样性搭配推荐结果的关键点。

建模方式：

1）Low-rank Mahalanobis Metric

将E看作是商品原始向量到latent space向量的映射关系，则映射后商品pair之间的距离是

2）Multiple, Non-Metric Embeddings

因为考虑到相互搭配的商品是可以在多个因素上近似的，比如款式、材质、印花、颜色等，而用风格这一个概念来概括就显得有些粗糙。所以可以有多个E，即用E_k来表示，每个E_k可以看作是一种特征提取的方式。其中第k种映射空间上，商品pair之间的距离为：

技术分享图片

3）Probabilistic Mixtures of Embeddings

将N种映射方式上的预测距离加权求和，那么权重如何确定呢？考虑到非对称的设定，应该主要与主商品的特征相关。如下：

技术分享图片

where U is a newly-introduced F*N parameter matrix with U_:;k being its k -th column.

最终，商品pair的距离为：

模型训练：

采用最大似然估计的方式计算loss并进行模型训练。

技术分享图片

2. Compatibility Family Learning for Item Recommendation and Generation

这篇paper同样是基于多因素进行搭配关系的建模，但与上一篇paper不同的是，主要假设是：可以与一个主商品进行搭配的pair商品可以是多种风格的。

paper提出了一种end-to-end的模型，将每个item映射到latent space上的K+1的向量，其中1个向量代表该item，另外K个向量代表该item的K个compatible prototypes，这些prototypes反应了搭配建模中的多样性，即可以与一个主商品进行搭配的pair商品可以是多种风格的。这K+1个向量即是该item的 compatibility family。

建模方式：

1）Projected Compatibility Distance

PCD是用于衡量两个商品之间的搭配关系的。

每个item可以被E₀映射为一个向量；另外还可以被E_k(k=1,2,...,K)映射为K个向量，每个向量都靠近与其搭配的商品所组成的cluster。PCD的计算方式如下：

技术分享图片