美文网首页
美国橄榄球联盟中裁判判罚方式的差异之数据可视化

美国橄榄球联盟中裁判判罚方式的差异之数据可视化

作者: Datartisan数据工匠 | 来源:发表于2017-08-24 10:51 被阅读28次

引子

计算机最棒的一点在于,它们能够将表格数据转换成更直观的图形表示。常常令我费解的是,明明可以将数据转化为图形表达,但大部分人却往往放弃了这个可视化机会。

例如,在 ESPN 上有一篇关于不同裁判判罚方式之间的差异的论文。这篇论文的数据相当有趣, 包含了显示裁判判罚方式差异的数据。

然而,我发现了一件略为尴尬的事,作者企图将表格数据可视化,但最后并没有实现。这或许是因为作者不知道该如何对这些数据作出最好的可视化,来讲述他的数据故事。因此,我决定帮他达到这个目的!

给定一个前提,假设裁判的判罚方式之间的确存在差异。基于这个前提,我们想要弄明白,他们的判罚方式的差异究竟在哪里。

下面的数据是来自文章中的表格数据:

论文作者指出:
Jeff Triplette 团队迄今总共判决出了 81 次判罚,比判罚次数仅次于他们的团队高出 18 次,是另外两个团队的 2 倍多。

论文作者接下来便继续谈论了他与正在推销新书的 Mike Pereira 的会面。

虽然上面的表格很有用,但它并没有经过任何可视化操作,你看到了可能会问:“天哪,这到底说明了些什么?”。直觉上来说,表格中的数据在有些地方不太对劲...但是我又说不清楚是什么不对劲。

让我们加总一下各个裁判团队判罚的防守点球数(防守越位、侵犯和中立区犯规数),看看数据会变成什么样:

现在,我们可以看到这些数据可能向我们揭示了什么,但这对偏好图形的人来说,还是会有些理解上的困难。如果我们利用这些数据,生成散点图,那就达到利用图形来展示这个问题的目的了。我们可以通过以下代码,绘出散点图:








上图中的蓝色水平虚线表示裁判的平均防守罚球点球数,蓝色竖直虚线表示裁判的平均侵犯判罚次数。灰色盒子表示由侵犯判罚次数和防守罚球点球数的 ( μ−2σ,μ+2σμ−2σ,μ+2σ ) 范围形成的区域。

是不是发现了什么?是的,我也注意到了。Jeff Triplette 团队在图上距离盒子如此之远,简直好像是他们裁判了一场假比赛一样,不过也有可能是他们看了假的裁判规则。

我希望我真正能做到的是,按照比赛规则,依据相同的分析过程,能对任一场比赛给出相应的分析。我并不指望这些分析会对 Jeff Triplette 团队以后的判罚方式产生什么影响,但不管怎样,这些分析向我们展示出了一些值得研究的异常数据点。

另外,你们能上我的 Github:https://github.com/miloardot/python-files/blob/master/Referees 找到这个项目的全部代码。

更多课程和文章尽在微信号:「datartisan数据工匠」

相关文章

网友评论

      本文标题: 美国橄榄球联盟中裁判判罚方式的差异之数据可视化

      本文链接:https://www.haomeiwen.com/subject/joisdxtx.html