美文网首页
推荐系统相关名词说明

推荐系统相关名词说明

作者: LaxChan | 来源:发表于2018-02-28 17:43 被阅读0次

物品流行度

标识多少用户同物品发生关系

相似度

衡量用户或者物品的距离或者相似度
i) 余弦相似度,其实就是归一化后的点积结果,
ii) 皮尔逊相关系数是去中心化&归一化的点积结果
iii) 修正余弦相似度,也是去中心化&归一化的点积结果,与皮尔逊的差别就在于去中心化的差异

  • 普通余弦相似度
    用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。值域为[-1, 1]: 1代表夹角为0°, 完全重叠/完全相似; -1代表夹角为180°, 完全相反方向/毫不相似。
    余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。


    2维图.gif

向量A,B的夹角的余弦计算如下:


余弦相似度.gif

扩展,向量A,B为多维(n维),则夹角的余弦计算如下:


余弦相似度_n维.gif
  • 皮尔逊系数
    余弦相似度在维度值缺失情况下的一种改进,如:
    A = (1, 2, 4)
    B=(3, -1, null),
    那么这两个向量由于B中第三个维度有null, 无法进行计算。
    皮尔逊相关系数的思路是, 我把这些null的维度都填上0, 然后让所有其他维度减去这个向量各维度的平均值, 这样的操作叫作中心化. 中心化之后所有维度的平均值就是0了, 也满足进行余弦计算的要求. 然后再进行我们的余弦计算得到结果. 这样先中心化再余弦计得到的相关系数叫作皮尔逊相关系数。
    计算公式:


    皮尔逊相关系数.jpg

    分子部分: 每个向量的每个数字要先减掉向量各个数字的平均值, 这就是在中心化。
    分母部分: 两个根号式子就是在做取模运算, 里面的所有的 r 也要减掉平均值, 其实也就是在做中心化。

  • 修正的余弦相似度
    解决余弦相似度仅考虑向量维度方向上的相似而没考虑到各个维度的量纲的差异性,所以在计算相似度的时候,做了每个维度减去均值的修正操作。
    同皮尔逊系数差异:
    a.) 修正cosine考虑的是对item i打过分的每个user u,其打分的均值,
    b.) Pearson考虑的是每个item i 的被打分的均值
    计算公式如下:


    修正的余弦相似度.jpg

预测准确度

对于测试集中的一个用户u和物品i,令rui是用户u对物品i的实际评分,而rui1 是推荐算法给出的预测评分

  • 均方根误差(RMSE)


    RMSE.gif
  • 平均绝对误差(MAE)


    MAE.gif

协同过滤算法

  • 基于用户(UserCF)
    令N(u)表示用户u曾经有过正反馈的物品集合,令N(v)为用户v曾经有过正反馈的物品集合


    userCF_余弦相似度计算.JPG

    e.g:


    userCF_余弦相似度计算_EG.JPG
    相似度算法改进User-IIF算法:
    通过惩罚了用户u和用户v共同兴趣列表中热门物品对他们相似度的影响。
    userCF_IIF.JPG
  • 基于物品(ItemCF)
    分母|N(i)|是喜欢物品i的用户数,而分子 N(i),N( j) 是同时喜欢物品i和物品j的用户数。因此,公式可以理解为喜欢物品i的用户中有多少比例的用户也喜欢物品j。


    itemCF_余弦相似度计算.JPG

    该公式会造成任何物品都会和热门的物品有很大的相似度,为了避免推荐出热门的物品,可以用下面的公式,惩罚了物品j的权重,减轻了热门物品会和很多物品相似的可能性:


    itemCF_余弦相似度计算_改进.JPG
    相似度算法改进Item-IIF算法:
    活跃用户对物品相似度的贡献应该小于不活跃的用户,增加IUF参数来修正物品相似度,N(u):用户U的活跃度
    itemCF_IUF.JPG

参考链接

相关文章

  • 推荐系统相关名词说明

    物品流行度 标识多少用户同物品发生关系 相似度 衡量用户或者物品的距离或者相似度i) 余弦相似度,其实就是归一化后...

  • 推荐系统

    推荐系统基础 推荐系统简介 了解推荐相关常用概念 知道推荐系统的工程架构和算法架构 知道推荐系统的常用算法 知道协...

  • redis多种模式部署(持续更新)

    1 部署说明 相关版本说明如下: 当前操作系统:CentOS Linux release 7.3.1611 red...

  • VMMap名词说明

    VMMap名词说明 Committed: 进程向OS宣称要使用的内存大小(在虚拟内存进行了分配),基本上都不等于进...

  • 推荐系统

    推荐系统就是用户有一个需求, 系统返回相关的item的系统。 推荐系统是非常重要的, 如在商场中, 商家需要决定需...

  • 推荐系统--系统架构

    这段时间公司的事情比较多,没有时间继续写推荐系统相关的内容。现在继续来学习推荐系统,这篇作为推荐系统第一阶段(不知...

  • Linux内核模块编程

    1.必须的头文件: //说明在内核编程 //说明在编写内核模块 2.针对/proc文件系统: 相关定义在 相关函数...

  • 多路召回及排序流程学习

    本人最近在学习推荐系统相关的算法,下面时根据天池新人赛-新闻推荐中task3-task5的学习理解,画的推荐系统中...

  • 关于系统tabbar的相关设置说明

    //设置Item选中不选中的一些处理 [[UITabBarItemappearance]setTitleTextA...

  • 【电子书分享】推荐系统实践-项亮.pdf

    今天给大家分享一本推荐系统相关的经典实用的图书《推荐系统实践.pdf》,该书通过大量代码和图表全面系统地阐述了和推...

网友评论

      本文标题:推荐系统相关名词说明

      本文链接:https://www.haomeiwen.com/subject/plgbxftx.html