美文网首页小白的数据分析师养成之路玩转大数据程序员
数据看英超 - 2003至2016赛季比赛数据探索

数据看英超 - 2003至2016赛季比赛数据探索

作者: 飘荡的鱼头头头头头大 | 来源:发表于2017-01-23 03:55 被阅读163次

    最近更新:2017年2月4日

    说明

    本报告选取了英超联赛作为分析对象,一共搜集了从2003年到2016年第23轮的英超比赛,共 5170场数据,包含了全场比分,全场射门数,全场射正数等25个变量。数据均来自于 football-data.co.uk。此外,我对这些数据预先做了部分处理,以便分析。


    单变量分析

    主客场胜负场次

    主客场胜负平场次

    在上图中,可以清楚的看到,主场球队(H)的胜率远远高于客场球队(A)的胜率,而平手率(H)是最低的。这也符合了我们经常说的主场优势。

    每场进球数

    每场进球数直方图

    从这张直方图可以看出,2003到2016赛季,进球数小于3球的比赛占了多数,最多的进球也没有超过10球。

    每场射门数

    每场射门数直方图

    2003到2016赛季,大多数的比赛全场射门数在25脚左右。

    每场射正

    每场射正数正直方图

    2003到2016赛季的命中门框范围内的次数如图分布所示,大多数的比赛有10次以上命中门框范围。

    每场出牌数(黄牌+红牌)

    每场出牌数直方图

    2003到2016赛季, 给3到4张牌的比赛最多。

    每场角球数

    每场角球数直方图

    2003到2016赛季的角球次数如图所示,大多数集中在5到10个左右。


    二元以及多元变量分析

    主队优势真的很大吗?

    主客胜负

    上图反映了2003到2016赛季主客场的胜利场数,可以发现每一个赛季都是主场球队胜利数多于客场球队取胜。这其实就很好的体现了“主场优势”。那么,主场优势究竟是怎么来的呢?换句话说,哪些因素造成了主队会比客队更有优势?

    主客队进球情况

    主场球队进球情况

    ##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    ##    0.000   1.000   1.000   1.532   2.000   9.000
    

    客场球队进球情况

    ##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    ##   0.000   0.000   1.000   1.129   2.000   6.000
    
    主客场球队进球场次

    主场球队的平均进球数高于客场球队0.403球,最大进球数也比客场球队多了3个球。下图的上半部分是主场球队进球数场次统计图,下半部分是客队进球数场次统计图。可以看出,主队进两球的比赛总数明显的多于客队进两球的比赛总数。

    为什么有主场优势这么一个说法 ——主队球队对比赛场地更为熟悉。大致意思就是主队球队的日常训练场地就是他们的比赛场地,所以常年累月下来,他们对环境更为熟悉,比客队更加清楚自己家的球门在哪里,自己家的草皮怎么样之类的,就像你知道你家门口包子铺的包子味道怎么样一样。因此,对于进攻队员来说,他们对自己家的球门更有方向感,所以会不会造成主队在射门比,甚至是命中率上超过客队呢?我们看一下数据,看看能不能解释这个说法:


    射门次数箱图

    上图是主客队的射门箱图,可以清晰地看到,主队比客队的射门更为频繁,进攻欲望更为强烈,当然,这可能和现场主队的球迷也有关,毕竟谁都想在自己家拿下比赛,回馈球迷的期待。同样的,我们也可以看到,在球队的射正次数方面,主队也是优于客队。


    射正次数箱图

    这种差异同样在角球数量上体现的很明显。


    角球次数箱图

    球队分析

    在2003赛季到2016赛季,一共有38支队伍出现在了英超赛场上,现在,让我们从几个方面来看一下他们的表现。

    主场胜负统计

    主场胜负统计
    上面这张图代表的是每个队作为主场球队参加比赛的情况,柱状图从左到有分别为输(客队胜),和,胜(主队胜)的次数。

    主场胜负统计

    客场胜负统计
    上面这张图则代表的是每个队作为客场球队参加比赛的情况,柱状图从左到有分别为胜(客队胜),和,输(主队胜)的次数。

    我们再合起来统计几个有趣的榜单。

    英超2003-2016最强主场?

    ##         team   win     n  win_rate
    ## 1 Man United   190   259 0.7335907
    ## 2    Chelsea   179   258 0.6937984
    ## 3    Arsenal   173   259 0.6679537
    ## 4   Man City   157   258 0.6085271
    ## 5  Liverpool   156   258 0.6046512
    ## 6  Tottenham   147   258 0.5697674
    

    曼联是2003-2016赛季中主场胜率最高的球队,胜率高达73.4%,紧随其后的是切尔西和阿森纳。

    英超2003-2016最差主场?

    ##        team   win     n   win_rate
    ## 1     Derby     1    19 0.05263158
    ## 2 Blackpool     5    19 0.26315789
    ## 3   Cardiff     5    19 0.26315789
    ## 4     Leeds     5    19 0.26315789
    ## 5       QPR    15    57 0.26315789
    ## 6   Watford    13    49 0.26530612
    

    这项排名中,德比郡荣获第一,他们在仅有的19场主场比赛中,只赢下了一场比赛,第二三名分别是布莱克浦和卡迪夫。

    英超2003-2016最强客场?

    ##         team   win     n  win_rate
    ## 1    Chelsea   146   259 0.5637066
    ## 2 Man United   138   258 0.5348837
    ## 3    Arsenal   125   258 0.4844961
    ## 4  Liverpool   106   259 0.4092664
    ## 5   Man City    93   259 0.3590734
    ## 6  Tottenham    90   259 0.3474903
    

    切尔西在客场发挥最佳,胜率达到了56.6%,实在是不容易,紧随其后的是曼联和阿森纳。

    英超2003-2016最差客场?

    ##      team   win     n   win_rate
    ## 1   Derby     0    19 0.00000000
    ## 2 Burnley     4    48 0.08333333
    ## 3 Cardiff     2    19 0.10526316
    ## 4  Wolves     9    76 0.11842105
    ## 5     QPR     7    57 0.12280702
    ## 6 Norwich    12    95 0.12631579
    

    德比郡在最差榜单完成了双杀,他们在19场客场中一场未赢,也就是说,他们在仅有的一个英超赛季中,就拿下了一场比赛的胜利,非常的郁闷。伯恩利和卡迪夫紧随其后。

    主客场胜率分布图

    主客场胜率总分布

    从这张图标我们可以看到曼联,切尔西,阿森纳,利物浦和曼城领跑,他们在主客场都有较好的表现。除此之外,还有富勒姆这种客场胜率很低,但是主场胜率比较高的球队。

    犯规和胜率

    在我们的印象中,一个球队如果作风很凶悍,比如经常会用犯规作为一个战术,他们的胜率是不是相对来说比较高一点?为此,我统计了每个球队犯规数和胜率之间的关系。

    总胜率 场均犯规次数

    利兹联成为了英超犯规最多的球队,他们以场均14次的犯规位居榜首,第二名是沃特福德。我们还可以看到德比郡也挤进了前五。

    犯规与胜率分布图

    然而,从上述的犯规与胜率分布图中我们可以看到,这两个变量不存在明显的相关性,相反犯规次数集中于中间的球队,他们的胜率看上去比较高。那我们只能这样来解释:因为犯规是阻碍对方进攻的一个手段,所以它是被迫的,犯规的次数越多,说明球队受到的压迫越多,所以场上的局面是对手较强。

    射正和胜率

    射正和胜率

    上图是射正和胜率的关系分布图,我们可以看到曼联是场均射正次数最多的球队,他们的胜率也是最高。我们可以看到明显的分为了两档球队,一档是曼联,切尔西,阿森纳,曼城,热刺和利物浦,另一档是其他球队。

    小心那个裁判!

    裁判与主客胜利场次关系图
    这张图反映了裁判和主场胜利次数 / 客场胜利次数的关系。颜色深浅代表着执法场次,越浅说明执法的次数越多。我们可以看到大都数裁判执法的比赛,主队胜数高于客队胜数(比率大于1),需要强调的是,不同的裁判,他们的主客场的胜率比的确不一样。在执教场次比较多的裁判中,比如Talyor和Halsey这两位裁判,明显的数值比较低,这不免让我们想象,他们对客场有特殊的偏好。如果你支持的球队遇上这个裁判,可要当心咯!

    我也对每个裁判的出牌数量做了统计,因为部分裁判执法比赛数较少,我选取了中位数,即执法39场,统计了超过39场裁判的场均出牌数,结果如下:


    场均出牌数

    结果很意外,因为2003-2016赛季最爱出牌的裁判是麦克迪恩!这哥们最近因为乱出红牌被下放到了英冠比赛,又在英冠比赛中吹了一个很有争议的球。当你支持的球队遇上这几个裁判,可得小心了,球员们应该也要注意自己的脚下动作,避免不必要的吃牌。毕竟裁判发起疯来不好惹!


    赛季探索

    比赛进球数数赛季分布图

    比赛进球数数赛季分布图
    比赛进球数赛季箱图

    每赛季场均进球数

    每赛季场均进球数

    每赛季场均射门数

    每赛季场均射门数

    每赛季场均射正数

    每赛季场均射正数

    每赛季场均出牌数

    每赛季场均出牌数

    每赛季场均犯规数

    每赛季场均犯规数

    每赛季主场胜率较高球队

    每赛季主场胜率

    每赛季客场胜率较高球队

    每赛季客场胜率

    总结

    我从上述一些列图表中,挑选了三张我认为最有趣的图表作为总结部分,这三张图表分别如下:

    主客场胜率总分布

    第一张柱形图展示了英超联赛中不同球队在主客场的胜率表现。我们可以看到像曼联,切尔西,阿森纳,利物浦和曼城这样的队伍,他们在主客场都有较好的表现。除此之外,我们还能发现存在着比如富勒姆这种客场胜率很低,但是主场胜率比较高的球队。相信你能轻松的在这张图上找到你支持队伍的主客胜率值和他们的排名。

    裁判与主客胜利场次关系图

    上面这张图反映了裁判和主客场胜负场次比的关系。横坐标是主场胜利次数与客场胜利次数比,纵坐标是裁判。你能清楚的在这张图中了解到某个裁判执法下主客场胜负比,每个人都有不同的胜负比。的确,裁判也是现代足球比赛中一个不可或缺的决定性因素。此外,我们也可以发现,随着裁判执法次数越多,主客场胜负次数比越低。

    胜率与场均射正次数关系图

    这张图反映了场均射正次数和胜率的关系。横坐标代表着场均射正数,纵坐标是胜率。每一个点代表着每一个参加英超的球队。我们可以清晰的看到一个趋势,基本上胜率越高的队伍,他们的场均射正数也越高。

    以上就是我对英超比赛数据的一些探索。这是我初入数据分析学习后的一次探索,其实还有很多好玩的比赛数据值得研究,比如阵型,控球率之类的,但由于数据的匮乏,我只能在表面稍微挖掘一点,希望以后有机会能够对英超比赛数据有个更深入的了解。

    相关文章

      网友评论

      本文标题:数据看英超 - 2003至2016赛季比赛数据探索

      本文链接:https://www.haomeiwen.com/subject/mvxabttx.html