美文网首页算法相关
PK制评分算法 - Elo Rating System - 埃洛

PK制评分算法 - Elo Rating System - 埃洛

作者: _小老虎_ | 来源:发表于2021-01-27 00:05 被阅读0次

    背景

    没有绝对的公平,并不是让我们放弃绝对公平,而是告诉我们,相对公平的极限 就是 绝对公平。

    在PK制/PVP博弈竞争事件中,会产生三种事件结果

    • 1)A Win

      • Score(A) + 1 A得一分
    • 2)B Win

      • Score(B) + 1 B得一分
    • 3)A - B Draw AB平局各自0.5分

      • Score(A) + 0.5
      • Score(B) + 0.5

    如果简单的审视这套规则,其实是相对公平的一套规则。

    但是如果加上一则前置条件

    以AB的历史积分为基础叠加分数。

    那么在满足一下条件下,会产生一个竞争不公平的问题

    • A参加的回合 > B参加的回合
    • A的历史积分 获胜局更多

    那么如果 A 赢了 B 则从客观的角度来讲属于正常预期,则 +1 分。

    但是如果B赢了A,依然也只是 +1 分。

    如上其实是相对不公平的加分制,那么如何更加权威性的去响应 AB事件的结果呢?

    ELO(Elo Rating System)算法就是用来解决此类问题的。

    发现

    ELO(Elo Rating System) 已经广泛应用于 国际象棋等PK制比赛中。

    《社交网络》这部电影中,在 10min左右的时刻 黑板上写了 ELO的计算期望值公式算法, 如下图

    image.png

    Elo Rating System

    ELO算法的基础成员如下
    • Ra = A 选手当前Rating

    • Rb = B 选手当前Rating

    • Sa = A 胜负值 Win:20 Lose:10 Draw:15

    • Sb = B 胜负值 Win:20 Lose:10 Draw:15

    • K = 10 常数,和单场比赛对于选手的影响权重 正相关。

    • Ea:预期A选手的胜负值

      • Ea=1 / (1+10^[(Rb-Ra)/400])
    • Eb:预期B选手的胜负值,

      • Eb=1 / (1+10^[(Ra-Rb)/400])
      • 同时成立关系 Eb = 1D - Ea
    举例 计算过程

    在竞技比赛中,分别有AB两位选手参赛
    A累计成绩 900
    B累计成绩 800

    • 计算AB期望值

      • Ra = 900

      • Rb = 800

      • ∴ Ea = 1 / (1+10^[(Rb-Ra)/400]) ~ 0.64

      • ∴ Eb = 1 - Ea ~ 0.36

    • 如果 B-Win 发生

    ∵ B 获胜
    ∴ Sa = 10, Sb = 20
    ∴ R'a = Ra + K(Sa - Ea) = SUM(900, 10(10 - 0.64) ~ 993.6
    ∴ R'b = Rb + K(Sb - Ea) = SUM(800, 10(20 - 0.36) ~ 996.4

    如结果所示,B的积分反超A的积分。


    西二旗波浪正弦组合

    音视频领域 技术研究分享;西二旗、后厂村 RD圈子的那些事儿。
    官方主页:https://www.zzsin.com/

    西二旗波浪正弦组合

    相关文章

      网友评论

        本文标题:PK制评分算法 - Elo Rating System - 埃洛

        本文链接:https://www.haomeiwen.com/subject/plxozktx.html