美文网首页算法相关
PK制评分算法 - Elo Rating System - 埃洛

PK制评分算法 - Elo Rating System - 埃洛

作者: _小老虎_ | 来源:发表于2021-01-27 00:05 被阅读0次

背景

没有绝对的公平,并不是让我们放弃绝对公平,而是告诉我们,相对公平的极限 就是 绝对公平。

在PK制/PVP博弈竞争事件中,会产生三种事件结果

  • 1)A Win

    • Score(A) + 1 A得一分
  • 2)B Win

    • Score(B) + 1 B得一分
  • 3)A - B Draw AB平局各自0.5分

    • Score(A) + 0.5
    • Score(B) + 0.5

如果简单的审视这套规则,其实是相对公平的一套规则。

但是如果加上一则前置条件

以AB的历史积分为基础叠加分数。

那么在满足一下条件下,会产生一个竞争不公平的问题

  • A参加的回合 > B参加的回合
  • A的历史积分 获胜局更多

那么如果 A 赢了 B 则从客观的角度来讲属于正常预期,则 +1 分。

但是如果B赢了A,依然也只是 +1 分。

如上其实是相对不公平的加分制,那么如何更加权威性的去响应 AB事件的结果呢?

ELO(Elo Rating System)算法就是用来解决此类问题的。

发现

ELO(Elo Rating System) 已经广泛应用于 国际象棋等PK制比赛中。

《社交网络》这部电影中,在 10min左右的时刻 黑板上写了 ELO的计算期望值公式算法, 如下图

image.png

Elo Rating System

ELO算法的基础成员如下
  • Ra = A 选手当前Rating

  • Rb = B 选手当前Rating

  • Sa = A 胜负值 Win:20 Lose:10 Draw:15

  • Sb = B 胜负值 Win:20 Lose:10 Draw:15

  • K = 10 常数,和单场比赛对于选手的影响权重 正相关。

  • Ea:预期A选手的胜负值

    • Ea=1 / (1+10^[(Rb-Ra)/400])
  • Eb:预期B选手的胜负值,

    • Eb=1 / (1+10^[(Ra-Rb)/400])
    • 同时成立关系 Eb = 1D - Ea
举例 计算过程

在竞技比赛中,分别有AB两位选手参赛
A累计成绩 900
B累计成绩 800

  • 计算AB期望值

    • Ra = 900

    • Rb = 800

    • ∴ Ea = 1 / (1+10^[(Rb-Ra)/400]) ~ 0.64

    • ∴ Eb = 1 - Ea ~ 0.36

  • 如果 B-Win 发生

∵ B 获胜
∴ Sa = 10, Sb = 20
∴ R'a = Ra + K(Sa - Ea) = SUM(900, 10(10 - 0.64) ~ 993.6
∴ R'b = Rb + K(Sb - Ea) = SUM(800, 10(20 - 0.36) ~ 996.4

如结果所示,B的积分反超A的积分。


西二旗波浪正弦组合

音视频领域 技术研究分享;西二旗、后厂村 RD圈子的那些事儿。
官方主页:https://www.zzsin.com/

西二旗波浪正弦组合

相关文章

网友评论

    本文标题:PK制评分算法 - Elo Rating System - 埃洛

    本文链接:https://www.haomeiwen.com/subject/plxozktx.html