美文网首页
数据分析入门学习之三

数据分析入门学习之三

作者: 巴山哥 | 来源:发表于2018-06-22 20:58 被阅读0次

    用PowerBI分析往届世界杯赛球队成绩

    用PowerBI与Python做个简单对比

    python分析文章请见用Python分析热门夺冠球队

    1、 获取所有世界杯比赛的数据(不含预选赛) 

    2、 获取世界杯所有比赛的前20强数据情况 

    2.1 获胜场数 

    2.2 进球总数量 

    2.3 参加场次

    数据来源于International football results from 1872 to 2018

    数据集包含以下信息:

    date - 比赛日期

    home_team - 主队

    away_team - 客队

    home_score - 主队进球数 (不含点球)

    away_score - 客队进球数 (不含点球)

    tournament - 比赛的类型

    city - 比赛所在城市

    country - 比赛所在国家

    neutral - 是否中立TRUE/FALSE

    一、导入数据

    从kaggle下载数据文件后用PBI导入,并筛选出世界杯比赛:

    二、数据检查

    2.1>查看PBI自动生成的代码,数据类型转换正确

    2.2>过滤出世界杯正式比赛场次,总共847场,数据比较“干净”

    简单浏览一下数据情况

    三、数据统计

    3.1>获胜场次统计

    制作报表:

    结果如下:

    巴西、德国、意大利、阿根廷获胜场次名列4强

    查看一下阿根廷的获胜场次情况:

    3.2>进球数统计

    分别统计出主、客进球,然后求和即可

    客队也如法炮制,然后合并结果生成报表:

    德国、巴西、阿根廷、意大利攻击力名列4强

    3.3>参赛场次统计

    与进球总数的统计方法相似,分别统计出主、客场次数然后合并相加,最后结果如下:

    德国、巴西、意大利、阿根廷名列4强,其中墨西哥名列第8,也是世界杯常客

    对本届32强XXX年以来的分析,采用同样的套路即可。

    过滤一下时间即可

    对于这种数量不大又很干净的数据,PowerBI做统计分析,其实比python+pandas更快捷!

    相关文章

      网友评论

          本文标题:数据分析入门学习之三

          本文链接:https://www.haomeiwen.com/subject/drpxyftx.html