推荐系统评测

作者: 逍遥小章 | 来源:发表于2016-12-20 20:06 被阅读332次

校招结束休息了快2个多月了,现在开始系统的学习推荐算法,基于项亮的书

一:推荐系统中主要有3种评测推荐结果的实验方法:

1:离线实验
2:用户调查
3:在线实验

离线实验的方法:
(1):通过日志系统获得用户行为数据
(2):将数据集分成训练集和测试集
(3):在训练集上训练模型,在测试集上进行测试
(4):通过事先定义的离线指标评测算法在测试集上的预测结果

用户调查:
顾名思义,但是招募测试用户的代价较大,很难组织大规模的测试用户

在线实验:
在完成离线实验和必要的用户调查后,可以将推荐系统上线做AB测试,将它和旧的算法进行比较

二:评测指标

1.预测准确度

预测准确度考虑推荐算法的预测打分与用户实际打分的相似程度。

平均绝对误差指标MAE(Mean Absolute Error):

1.jpg

平均绝对误差MAE:

image
平均平方误差MSE:
image
标准平均绝对误差(做标准化):
image

预测准确度

|预测准确度|
--|-------
优点|平均绝对误差MAE: 1.计算方法简单,易于理解; 2.每个系统的平均绝对误差唯一,从而能够区分两个系统平均绝对误差的差异
缺点|不适合二元选择信息,如喜欢或不喜欢不适合那些只在意推荐列表前端的预测误差,而对系统的整体误差并不是很在意的系统在用户偏差的程度比较小时也不适用,因为用户只关心把好产品错归为坏产品 ,或者把坏产品错归为好产品的比例。例如 ,以 3.5个星为界区分好坏 ,那么把4预测成了5,或者把3预测成了2都对用户没有影响。

准确率(Precision),召回率(Recall),覆盖率(coverage)

为了评估推荐算法的好坏需要各方面的评估指标。

    对用户u推荐N个物品(记为R(u)),令用户u在测试集上喜欢的物品集合为T(u)

<b>准确率</b>就是最终的推荐列表中有多少是推荐对了的。描述最终的推荐列表中有多少比例是发生过的用户-物品评分记录。

<b>召回率</b>就是推荐对了的占全集的多少。描述有多少比例的用户-物品评分记录包含在最终的推荐列表中。

下图直观地描述了准确率和召回率的含义

<b>覆盖率</b>表示推荐的物品占了物品全集空间的多大比例。
最简单的覆盖率的定义如下:

新颖度新颖度是为了推荐长尾区间的物品。用推荐列表中物品的平均流行度度量推荐结果的新颖度。如果推荐出的物品都很热门,说明推荐的新颖度较低,否则说明推荐结果比较新颖。

这篇文章可以参考看一下,比我总结的清晰
http://blog.csdn.net/wangyuquanliuli/article/details/36684817

相关文章

  • 推荐系统实践学习系列(一)好的推荐系统

    主要学习内容: 1、什么是推荐系统 2、个性化推荐系统的应用 3 、推荐系统评测指标 4、 推荐系统评测 一:什么...

  • 推荐系统简介

    本文主讲:1.推荐系统应用场景2.如何评测一个推荐系统的好坏 1.个性化推荐系统--应用实例 2.评测一个推荐系统...

  • 【推荐系统实践-01】推荐系统简介

    项亮老师的《推荐系统实践》学习笔记​。​ 目录 1、什么是推荐系统 2、个性化推荐系统应用场景 3、推荐系统评测推...

  • 推荐系统评测

    校招结束休息了快2个多月了,现在开始系统的学习推荐算法,基于项亮的书 一:推荐系统中主要有3种评测推荐结果的实验方...

  • 第一章 好的推荐系统

    本章提出的问题 1. 什么是推荐系统? 2. 推荐系统有那些应用? 3. 推荐系统怎么评测? 今天是2019-07...

  • 推荐系统实践-评测

    此文是根据《推荐系统实践》部分整理而来。 PART 1 首先,最核心的问题是 什么才是好的推荐系统? 好的推荐系统...

  • 评价推荐系统的几个指标

    前言 推荐系统的评测指标用于评价推荐系统的各方面性能。这些指标(之前微信公众号推送过一篇文章:《推荐系统的十二大评...

  • 常见推荐系统介绍

    本文主要是对项亮的推荐系统实践部分章节进行了一些总结,先从什么是推荐系统开始讲起,然后介绍了评测推荐系统的指标和方...

  • 推荐系统评测方法和评测指标

    一般推荐系统的参与方有3个:用户、物品提供商、推荐系统提供网站,评测一个推荐系统时,需要考虑3方的利益,一个好的推...

  • 推荐系统常用评测指标

    1.推荐系统常用评测指标2.回归评价指标MSE、RMSE、MAE、R-Squared

网友评论

    本文标题:推荐系统评测

    本文链接:https://www.haomeiwen.com/subject/xxsfvttx.html