一种构造推荐系统的方法 :“基于内容的推荐”
举例:每一部电影都用一些特征来描述,假设每部电影有两种特征,分别用x1和x2代表,x1表示这部电影,属于爱情电影的程度;x2表示这部电影是动作电影的程度,然后用一个特征矩阵表示,加一个额外的特征变量截距特征变量 x0 其值为1。用 n 表示特征变量数,但是不包括 x0
基于内容的推荐把对每个观众打分的预测当成一个独立的线性回归问题(实际上就是对每个用户应用不同的线性回归模型 ),具体来说比如每一个用户j,我们都学习出一个参数θ(j),在这里是一个三维向量(θ(j) 表示用户j对应的参数向量;x(i)是某部电影i的特征向量)。更一般的情况是θ(j)为一个n+1维向量,n是特征数,不包括截距项x0,然后根据参数向量θ与特征x(i)的内积来预测用户j对电影i的评分。
问题描述m(j)来表示用户j评价过的电影数。另外就是选择一个参数向量θ(j)使得预测的结果尽可能接近训练集中的观测值。
求和序列的读法是对所有满足 r(i,j)=1的这些i进行求和运算,求出了所有用户j所评价过的电影。对于推荐系统,为了让数学更简单,要去掉这个m(j)。这就一个常数,可以去掉这一项不改变θ(j)的最优化结果。
优化对象 算法优化
网友评论