昨天有聊到短视频,为什么这么火?
用一句话总结就是,短视频内容表现更丰富,传播速度更快,用户接受度更容易,也更直接…
昨天在文末已经定好了标题,现在看来显然有些标题党了。
如今的数字生活让很多人,都疑神疑鬼。
之前我跟我一个朋友在微信聊,我说我想买双雪地靴,接着我就打开京东。令人匪夷所思的事情就发生了。太恐怖了。为什么在推荐搜索里面是xxx雪地靴、xxx保暖雪地靴…
这使我陷入了深深的思考,我很惶恐,难道我的个人信息被窃取了吗?我的微信被监听了吗?我开始检查微信的每一个设置按钮。是不是我有开启什么样的权限,而导致我的信息泄露了。相信你也有这样的境遇,细思极恐。
电话被窃听显然不可能,其实是你的行为数据暴露了你的“需求”。
当我们注册账户时我们需要填写姓名、电话号码,有时候需要填写性别、所在地等个人信息。当然这些微不足道基础信息收集也太容易了。是的,很多APP也是必须注册才能使用,他们也就通过这样的基础信息让销售人员打电话、加微信一系列操作。当然,这也在培训行业尤为突出,也可能是我聚焦的是培训行业,其他行业也不例外。
我们前面提到说这些基础信息都是微不足道,显然这些基础信息就对我们某些程度上已经造成了不必要的骚扰,那还有比这更重要的信息吗?是的,在推荐算法面前这些基础信息都显得微不足道,起决定因素的包括:你的打车频率、消费记录、关注公众号、玩什么游戏、发过的红包、有没有车贷、房贷、保险、浏览习惯等…
这些行为最后会形成几千上万条事实标签,成为你行为数据的一部分。
采集这样的事实标签也并不难,难的是建立模型,从这些杂乱的事实标签中找到你真正感兴趣的,从而构建用户画像。
打个比方,你点开一条标签为美女的短视频,这其实并不意味着你喜欢看美女,这需要从你更多的行为标签来判断这条短视频对你的吸引力。
这是一个基础的行为标签权重算法:
兴趣标签=行为权重X访问时长X衰减因子
行为权重:什么都不干1分,评论+1.5分,点赞+0.5分,转发+2分,收藏+1.5分
时长权重:5s以上0.5分,完播1分
衰减因子:0-3天权重1,3-7天权重0.85,7-15天权重0.7,15-30天权重0.5,三十天以上权重0.1
行为权重对应你是否有评论、点赞、转发、收藏等操作,不同的操作有不同的数值,累计相加形成行为权重。
访问时长对应的是,停留时间越长,时间权重就越高。
最后衰减因子,短期行为也无法代表长期兴趣,单次阅读的行为会随着时间流逝而不断衰减。
于是,你每次打开美女内容就会形成一个兴趣权重,把一段时间内你所有的美女兴趣权重进行叠加,再用S形函数标准化,就能得到一个0~10区间的兴趣标签。
筛选S函数数值越大说明你就对美女越感兴趣。
这里我们就能很直观的了解到为什么推荐给我们的内容我们喜欢而欲罢不能。随着技术的不断更新迭代很多大厂也更新了更多的算法标准。
除了内容兴趣,这种模型也可以在消费能力,消费兴趣,消费习惯,社交习惯等多个纬度建立模型,计算你的偏好。
最后这些标签就会转化成为特征项量,假设你的特征项量美女标签值是6,消费习惯能力值是7,社交偏好是5,就可以用项量表示为r(6,7,5)。
用户特征项量同时他们就把标签为你的项量丢进跟你项量数值一样的流量池,这样内容推荐以及广告主就能很容易找到他们的受众群体了。
代入余玄公式如果你对这个话题感兴趣,你可以在腾讯广告平台,开发者文档,进一步了解你的数据被处理到了什么程度。
需要说明的是这些APP采集的不仅仅是对应你的账号,更与你的手机唯一识别码绑定在一起。
安卓的叫IMEI,iphone的叫IDFA
这也意味着就算你不注册,你的行为数据也会被采集。
不过也不必太紧张,根据《个人信息安全规范》商业广告数据应该避免精确定位到个人,以保护个人的安全隐私。
本节(完)。
下一节我们聊聊
网友评论