互联网发展的早期,信息如何分布如何展现在内容网站一直都是比较重要的问题;人们在历史经验的基础上将经验算法化来对内容进行排序,而解决的是绝大部分用户在网站上的体验(因为影响因子是群体数据)。
举例投票型网站
影响因素:投票行为和时间
P是赞成票数 T是发布时间 G是衰减系数其他常数是场景优化的参数
可以看到随着时间的衰减,相同时间赞成票越多的内容热度高;场景优化
某些产品不仅有赞成,也有反对;这个时候我们可能就需要通过差值(P)来表现内容的优劣。而且投票方向(P正负)会影响时间因子对整体得分的影响方向(差的应该比好的衰减快)
如果担心样本数据的基数对分值的影响(基数越大,越有参考性),还要对P的系数进行调整,基数越大,P的权重越大
有些时候我们担心马太效应,会对差值log来调整高额时的影响幅度(赞成票到一定程度影响不会特别大了)。
所有的这些都是我们通过历史经验对结果进行预期,什么是好的,什么对有影响,什么对结果的影响比较大都会体现在公式中
网友评论