美文网首页
一文明白推荐系统(小白推荐)

一文明白推荐系统(小白推荐)

作者: dd1991 | 来源:发表于2018-10-08 20:37 被阅读0次

    一 推荐系统概述

           推荐系统目前几乎无处不在,主流的app都基本应用到了推荐系统。例如,旅游出行,携程、去哪儿等都会给你推荐机票、酒店等等;点外卖,饿了么、美团等会给你推荐饭店;购物的时候,京东、淘宝、亚马逊等会给你推荐“可能喜欢”的物品;看新闻,今日头条、腾讯新闻等都会给你推送你感兴趣的新闻....几乎所有的app应用或网站都存在推荐系统。

    推荐系统目的:

       1.帮助用户找到想要的商品(新闻,音乐等),发掘长尾(后文有简介)

       2.降低信息过载,即现在是信息大爆炸的时代,物品越来越多,信息越来越多,而人的精力和时间是有限的,需要一个方式去更有效率地获取信息,链接人与信息。

      3.提高站点的点击率和转化率(电商,论坛,微博等)

    针对用户:

           在用户明确的需求下:比如我们去便利店选购苹果,我们可以凭经验去找到小摊位购买;在大型商场,我们可以通过导购牌分类,先找到出售生鲜水果的楼层,进而购买苹果;在淘宝,京东等电商网站上,我们则是通过搜索引擎,来跳转到相关的界面来选能够

           在用户没有明确需求下:在信息过载的背景下,我们可以通过朋友介绍推荐,豆瓣参考评分等一系列的导游等等,这些统称为推荐系统

           推荐系统不需要用户明确的需求,而是通过用户的历史记录,历史行为来给用户兴趣的模型,从而主动给用户推荐能够满足他们的兴趣和需求的信息

    针对商家:

           推荐系统可以更好的挖掘物品的长尾词(传统的80/20,即传统的80%的销售来源于20%的热门品牌);主流商品往往代替了大部分用户的需求,而长尾商品往往代表了一部分的个性需求。

           推荐系统的本质是通过了一定的方式将用户和物品联系起来,而不同的推荐采用不同的方式,比如利用好友,用户历史兴趣及其用户的注册兴趣信息等!


    二 推荐系统的应用

           个性化的推荐系统需要依赖用户的行为数据,主要是通过分析大量的用户的行为,给不同的用户提供不同的个性化页面展示,来提高网页的点击量和转化率!

    领域: 电子商务,电影,音乐,社交,服务,广告等!

    (1)电子商务 —— Amazon

    个性化推荐列表;相关推荐列表(打包销售)

    (2)电影和视频网站 —— Netflix

    (3)个性化音乐网络电台 —— Pandora 豆瓣

    注意音乐推荐具有很多特殊点

    (4)社交网络 —— Facebook

    Facebook有个推荐API

    (5)个性化阅读 —— GoogleReader Zite

    (6)基于位置的服务

    位置是一种很重要的上下文信息

    (7)个性化邮件 —— Tapestry

    (8)个性化广告 —— Facebook 


    三 评测指标

    1 用户满意度  最重要指标 

    2 预测准确度    (评分预测;TopN推荐:准确率,召回率,度量等)

    3 覆盖率 :推荐系统对于物品的长尾的挖掘能力(推荐效应初衷就是为了消除马太效应,即强者俞强,弱者遇弱,可以理解为热门商品越热,冷门商品越冷)

    判断是否具有马太效,可以利用基尼系数判断(即G2>G1;评测推荐系统是否具有马太效应的简单方法就是使用基尼系数,如果G1是从初始用户行为中计算出的物品流行度的基尼系数,G2是从推荐列表中计算出的物品流行度的基尼系数,那么当G2>G1时,就说明推荐算法具有马太效应)

    4 多样性  不在一棵树上吊死

    5新颖性  是指给用户推荐那些他们之前没有听说过的物品

    6 惊喜性

     注意与新颖性进行区别,尚没有公认的定义指标,只能通过问卷调查获取

    7 信任性

    提高推荐系统的信任度主要在于需要增加推荐系统的透明度,即提供对推荐系统的解释,让用户明白其运行机制

    考虑用户的社交网络信息,利用好友信息进行推荐,利用好友进行解释等

    8 实时性

    (1)推荐系统需要实时地更新推荐列表来满足用户新的行为变化 —— 通过推荐列表的变化速率来评测

    (2)推荐系统需要能够将新加入系统的物品推荐给用户 —— 利用用户推荐列表中多大比例的物品是当天新加入的来评测

    9 健壮性

    (1)健壮性衡量一个推荐系统抗击作弊(人为攻击)的能力

    (2)评测主要利用模拟攻击

    (3)可以通过以下手段提高系统健壮性:

    设计推荐系统时尽量使用代价比较高的用户行为,例如将浏览行为换为购买行为

    在使用数据前,进行攻击测试,从而对数据进行清理

    10 商业目标

    与网站的盈利模式相关

    11 总结

    (1)对于离线优化来说,一般在给定覆盖率、多样性、新颖性等约束条件下,优化预测准确度。

    (2)为了充分了解一个算法的性能,应该在多个维度上进行评测:

    用户维度:主要包括用户的人口统计信息、活跃度以及是不是新用户等

    物品维度:包括物品的属性信息、流行度、平均分以及时不时新加入的物品等

    时间维度:包括季节、是工作日还是周末,是白天还是晚上等


    欢迎各位大神交流,交流QQ群:688933850

    相关文章

      网友评论

          本文标题:一文明白推荐系统(小白推荐)

          本文链接:https://www.haomeiwen.com/subject/apwjaftx.html