一.大数据是什么?
大数据简单的理解就是很多很多的数据,很多很多种类型(用户人工判断不出或者无法判断,但实际这些数据是相关的)如何发现和利用这些数据间的相关性才是大数据应用的核心。
大数据分析:对规模具大的数据进行分析,是一个发现问题、提出假设、印证猜想、不断优化的过程。
二.如何利用大数据,让大数据发挥价值?
大数据我是有了,要怎么利用它们?
一切不谈具体应用场景的大数据都是耍流氓。
三.实例解读大数据的应用。
今日头条
你关心的,才是头条!
介绍今日头条的个性化推荐机制(简介+分析)
个性化推荐机制,7亿人有7亿种不同的头条,最大化保证推送的精准度,尽量保证对的文章推荐给对的人——归根到底这个推荐算法关键是还在于对海量用户行为的数据分析与挖掘,通过对海量数据的深度挖掘,今日头条不仅能够为每一个人按兴趣推荐信息,还能够从宏观的角度得到大众群体的阅读趋势。
今日头条它这个平台的用户有什么特点。这个也十分重要,就是你首先要了解它,才能知道怎么去搞定这批人,这批人需要什么。
用户在通过社交账号登陆时,算法会解读用户兴趣,形成用户画像,根据用户画像来推荐感兴趣的文章。在用户使用过程中,算法会根据用户的点击、搜索记录、订阅等行为优化用户画像。
冷启动
拿我的微博dandan米娜接入今日头条后,系统后台便会对我的兴趣作出分析,建立初始的DNA数据,并根据这些兴趣的权重来进行推荐。当然,因为这只是第一步,所以我们称之为冷启动。
所以,在冷启动的基础上,随着用户行为数据的积累,系统为每个用户建立的兴趣模型就越精确,你会感觉到这款产品越来越懂你,这也是所有个性化推荐系统的基本原理。
根据其社交行为、阅读行为、地理位置、职业、年龄等挖掘出兴趣。通过社交行为分析,5秒钟计算出用户兴趣;通过用户行为分析,用户每次动作后,10秒内更新用户模型。这些用户行为数据会实时性地被传送到后台
如果用户不登录,头条会推荐一些大众化的内容,再根据用户点击(反馈)来确定用户画像。
文章经过审核和消重后,会分批次推荐给用户。
首先推给最感兴趣的用户,然后根据这批用户的反馈信息决定下一批的推荐量,反馈信息包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占的权重最高。
首轮推荐后,如果点击率低,系统就认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。
以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。
而今日头条是一款基于机器学习的个性化推荐引擎,其基本逻辑主要有两条:
第一,用户使用App越多时,发生的动作类型就越多,如用户的互动、阅读内容的数量、速度及场景等。通过这些动作收集而来的数据能够完整的描述用户画像,就像医生见到病人后从各个角度进行观察,并把其特征描述地很细。当细化的描述形成有结构的表格后,今日头条就能“认识”每一个人。然后再以同样的方法“认识”每篇文章、每个关键词后,系统就能够让他们在向量空间中拥有各自的位置,并通过算法进行匹配。当匹配度越高的时候,系统就认为这是该用户最想得到的信息,并进行推送。
第二,用户可能之前没有足够的历史信息提供给数据库。(模型匹配)这种情况就需要第二条逻辑来为他们提供感兴趣的信息,即“越多的人用越懂你”。即便用户对推荐引擎来说是陌生的,但总会有相同特征的用户,比如使用苹果手机的男性、三十到四十岁年龄之间等人群画像是系统已经了解过的。它可以据此对类似人群进行解读,把用户最可能感兴趣的信息推送过去。因此,每个人的头条都是不一样的,即“你所关心的才是头条”。 按照以上两条逻辑,对文章和用户的匹配和连接对象进行了更细化的拆分。今日头条的推荐引擎按照关键词和分类先把文章分到具体的特征向量中,再对用户进行定位,并分配到具体的特征向量中。最后将这两者进行匹配,按照推荐引擎学习到的算法,把不同的信息推送到每位用户。
在整个推荐过程中,受众也会对文章进行反馈。对于反馈信息,会把它沉淀下来放到媒体实验室,而媒体实验室就是对今日头条后台数据进行提取和分析的数据产品。但媒体实验室现在最主要的功能就是来促进创作、服务创作者,用数据来告诉创作者,目前的内容的潮头在哪里?他们写什么样的东西可能会受欢迎?受众是什么样子的?等等。
网易云音乐
2013-2017。截至目前用户量突破3亿。优势在哪里~
场景:很多用户打开音乐播放器一脸懵逼 ,不知道要听啥才好。
现在主流都是通过机器学习的方式,通过同类人类的偏好给相似的人群推荐他们都喜欢的歌曲。
初始化用户画像口味,(根据用户个性标签及时推荐)在网易云音乐你有一千种发现好音乐的方式。网易云的每日歌曲推荐和私人FM推荐的歌曲都很懂你,你喜欢听什么,它都知道,很人性化。
个性推荐:私人FM+每日歌曲推荐+云音乐热歌榜(自定义调整/排序位置/是否显示)
精准的个性化推荐离不开强大的数据支撑
四.我们该如何让大数据来驱动产品。
如何利用数据驱动产品设计?
数据驱动的产品(data-driven products)
从产品角度出发,大数据可以为产品经理提供产品迭代的数据支持。通过数据来描绘出用户画像
循环模式:
在循环的过程中,收集到了一定程度就会形成固化规律,推荐也就愈加的准确(越用越懂用户),用户体验提升,用户粘性提升。
我们通过采集数据,可捕捉视频平台/OTT盒子的用户交互行为,并向内容创作者提供详尽的分析报告,帮助他们对重要的指标做出优化(参与率、播放率、转化率等),帮助我们实现智能个性化的推荐,提高用户体验,留住用户。
1.用户行为分析
行为分析/漏斗分析/留存分析/回访分析/用户分群
数据驱动运营
合适的方法是要经过不断的实验去验证,验证的过程也是在校验数据,从而优化运营策略,提升用户新增和留存。
参考资料:
艾瑞咨询:2016年中国数据驱动型互联网企业大数据产品研究报告(附下载)http://www.199it.com/archives/549938.htmlhttp://www.36dsj.com/archives/73538
今日头条的文章推荐机制及运营规则 https://150643.com/414.html
数据挖掘系列篇(9):今日头条的个性化推荐https://zhuanlan.zhihu.com/p/20501759
dandan米娜:一枚快乐的产品喵,爱生活、爱微笑、爱分享,努力学习成长ing~
网友评论