推荐系统论文阅读（一）利用用户和物品的分层结构

论文

Exploring Hierarchical Structures for Recommender Systems

背景

补全"用户——物品"的评分矩阵(如下图所示), 从而能够凭借评分矩阵进行物品的推荐.

图一

基础模型

加权的非负矩阵分解weighted nonnegative matrix factorization (WNMF), 公式如下图所示(W是一个指示矩阵, 元素为0表示缺失值, 元素为1表示未缺失):

图二

动机

商品(或者用户)存在自身的层次结构, 相同层次结构的商品(或者用户)共享相似的特征. 如果将先验的层次信息加入到模型中将会提高预测精度.例如: 音乐可以分为古典音乐, 爵士音乐, 乡土音乐等等, 爵士音乐又可以分为经典的爵士音乐等等，如下图所示(可以看出本文的层次结构主要是指一种树形的分层结构):

图三

难点

如何将结构信息建模, 主要分为在显示的情况下(告诉你分类信息), 在隐式的情况下.(结构信息未知).

本文提出的模型

The Proposed IHSR

隐式情况下, 建模层次结构, 公式如下:

图四

核心思想: 深度的矩阵分解, 将原先的物品矩阵(用户矩阵)进一步向下分解, 相当于将物品不断地归类.模型的概述如下图所示:

图五

例如:

将原先 d $\times$ m 维的V矩阵分解为 d $\times$ m1维的V2矩阵和 m1 $\times$ m的V1矩阵, 表示将原先的m个物品归类为m1类, 每个类用d维向量表示, V1矩阵则表示着m个样本与m1个类别之间的映射关系, 可以看成表示哪些样本属于哪些类别.

The Proposed HSR

首先定义Q矩阵:

图六

如上图所示, 如果已知物品(或者用户)的类别先验信息, 那么对于v1~v8八个物品, 就可以不断地将物品进行归类. 最下面一层是最初的叶子节点表示着这八件物品, 接下来可以归类成为上一层的4个类别, 最终归类成为最上层的2个类别.

定义Q2矩阵为 4x2 的矩阵:

图七

Q2矩阵表示着第一层与第二层之间的关系(从上往下看). 第(1, 1)的元素为1, 表示第一个子类属于第一个父类; (2, 1)元素为1, 表示第二个子类属于第一个父类; (3, 2)元素为1, 表示第三个子类属于第二个父类; (4, 2)元素为1, 表示第四个子类属于第二个父类. 可以看出Q矩阵是一种子类与父类关系的表示矩阵, 因此可以通过一系列Q矩阵表示各个层次的关系.

接着, 显式情况下建模, 公式如下: