美文网首页
互联网游戏数据分析(SQL)

互联网游戏数据分析(SQL)

作者: 弦好想断 | 来源:发表于2020-08-20 01:45 被阅读0次

    一、数据概览

    数据共有828934条,108列标签

    本文主要对以下10个字段进行分析

    使用工具:Navicat Premium ,jupyter notebook
    技能要求:SQL掌握到子查询,Python连接数据库(不连也可以)

    二、提出问题:

    1、新增玩家分析:从玩家数量、玩家占比、每日新增玩家数展开分析
    2、玩家活跃度分析:从不同用户在线时长、分布特征展开分析
    3、玩家付费情况分析:从PUR(付费比率)、ARPPU(活跃付费用户平均消费金额)等关键指标展开分析
    4、玩家游戏习惯分析:从不同玩家类型、游戏模式(PVP与PVE)得出的情况来展开分析

    三、新增玩家分析

    新增玩家数量:828934人

    SELECT count(DISTINCT user_id) 新增玩家数量 FROM `tap_fun_test`
    

    新增付费玩家数量:19549

    select count(DISTINCT(user_id))  新增付费玩家数量 from tap_fun_test where pay_price >0;
    

    付费玩家占比:0.0236

    select 新增付费玩家/新增玩家数 as 付费玩家占比 from 
    (SELECT count(distinct user_id) 新增玩家数 from tap_fun_test) as t1 ,
    (SELECT count(DISTINCT user_id)  新增付费玩家 from tap_fun_test where pay_price>0) as t2 ;
    

    每日新增用户数量

    select date(register_time) 日期,count(DISTINCT(user_id)) from tap_fun_test GROUP BY 日期;
    

    每日新增付费用户数

    select date(register_time) 日期,count(DISTINCT(user_id)) from tap_fun_test where pay_price>0 GROUP BY 日期;
    

    每日新增玩家在3月10日有一次大高峰增长,可能举办活动,但活动一过后续新增玩家数并没有显著提升,可见活动没有游戏的人气带来实质性的帮助。
    活动需要力度加强并保持一定时间维度,给玩家充分时间了解游戏,才能提高秀逸热度。

    全部玩家平均在线时长:11.741103057664969

    SELECT avg(avg_online_minutes)  as 全部玩家平均在线时长 from tap_fun_test;
    

    付费玩家平均在线时长:135.8732415946089

    select avg(avg_online_minutes) from tap_fun_test where pay_price>0;
    

    四、玩家活跃度分析

    平均在线时长的分布特点

    全部玩家人数的中位数、上下四分位数

    select round(count(distinct user_id)/4) as 下四分位数,
    round(count(distinct user_id)/2) as 中位数,
    round(count(distinct user_id)/4*3) as 上四分位数
    from tap_fun_test;
    

    下四分位数:207234 中位数:414467 上四分位数:621701

    全部玩家在线时长箱线图关键值

    SELECT min(avg_online_minutes) 最小值,
    (select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 207233,1) as 下四分位数,
    (select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 414466,1) as 中位数,
    (select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 621700,1) as 上四分位数,
    max( avg_online_minutes) 最大值
    FROM `tap_fun_test` 
    

    最小值0.0,下四分位数:0.5,中位数:1.666667,上四分位数:5,最大值:1605.833333

    付费玩家的人数最大值最小值、中位数、上下四分位数

    select round(count(distinct user_id)/4) as 下四分位数,
    round(count(distinct user_id)/2) as 中位数,
    round(count(distinct user_id)/4*3) as 上四分位数
    from tap_fun_test 
    WHERE pay_price>0;
    

    下四分位数:4887, 中位数:9775 上四分位数:14662

    付费玩家在线时长箱线图关键值

    SELECT min(avg_online_minutes) 最小值,
    (select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 4886,1) as 下四分位数,
    (select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 9774,1) as 中位数,
    (select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 14661,1) as 上四分位数,
    max( avg_online_minutes) 最大值
    FROM `tap_fun_test` 
    where pay_price>0;
    

    最小值:0.3333 ,下四分位数:30.6667,中位数:84.5,上四分位数:191.1667,最大值:1081.5

    全部玩家的在线时长箱线图中向下压缩的很厉害,全部玩家上四分位数为5,说明75%的玩家平均在线只有大约5分钟,可能一局游戏都没有玩完,可见玩家流失情况比较严重。
    付费用户的箱型图中下四分位数为30,中位数84,上四分位数为191,说明付费用户中75%以上的用户在线时长都超过了30分钟。

    五、玩家付费情况分析

    关键指标

    AU(active users)活跃用户:游戏时长超过15分钟
    PU(Paying users)付费用户
    APA(Active Paying Account):活跃付费用户数
    ARPU:平均每个活跃用户的收入,总收入/AU
    ARPPU:平均活跃付费用户收入,总收入/APU
    PUR(付费比率):APA/AU

    每个活跃玩家的收入

    select count(DISTINCT user_id) as AU,
    (select sum(pay_price) from tap_fun_test as 总收入),
    (select sum(pay_price) from tap_fun_test) /count(DISTINCT user_id) as 每个活跃玩家收入 
    from tap_fun_test 
    where avg_online_minutes > 15;
    #and pay_price>0;每个活跃付费玩家的收入
    
    AU:99846,总收入:556900.04,每个活跃玩家收入ARPU:5.57758989

    每个活跃付费玩家的收入

    APA:16982,总收入:556900.04,每个活跃付费玩家收入ARPPU:32.79354846

    付费比率

    select count(DISTINCT user_id) as APA ,
    (SELECT count(DISTINCT user_id) from tap_fun_test WHERE avg_online_minutes>=15) as AU ,
    count(DISTINCT user_id)/(select count(DISTINCT user_id) from tap_fun_test 
    where avg_online_minutes>=15) as PUR
    from tap_fun_test 
    where avg_online_minutes>=15 and pay_price >0;
    
    APA:17005;AU:100649;活跃玩家的付费率PUR:0.169,全部玩家的付费比率:0.021

    该游戏的PUR(人均付费率)为0.169较低,且ARPU(活跃玩家平均消费额)为5.58,说明收入表现差;相对于ARPPU,活跃付费用户消费很高,是ARPU的6倍左右,针对这点我们可以做首次消费门槛和专属大V玩家的福利与活动进行调整与优化。

    六、玩家游戏习惯分析

    select AVG(pvp_battle_count) as 平均PVP次数 ,
    sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP概率,
    sum(pvp_win_count)/sum(pvp_battle_count) as PVP获胜概率
    from tap_fun_test
    where avg_online_minutes>=15;
    PVP活跃玩家
    平均PVP次数:15.164651412333953;主动发起PVP概率:0.5688357584679884;PVP获胜概率:0.532222547626395
    PVP活跃付费玩家(加一个pay_price>0)
    平均PVP次数:27.301911202587473;主动发起PVP概率:0.6553937480210826;PVP获胜概率:0.6872459716242092
    

    PVE活跃玩家
    平均PVE次数:28;主动发起PVE概率:0.9967;PVE获胜概率:0.9041
    PVE活跃付费玩家
    平均PVE次数:52;主动发起PVE概率:0.9957;PVE获胜概率:0.9110

    APA(付费活跃用户)玩家的平均PVE和PVP次数都是AU(活跃)玩家次数的两倍左右,显然APA玩家是重要的发展对象。
    PVP活动中,APA玩家主动发起和胜利的概率都明显高于AU玩家。
    PVE活动中,APA玩家主动发起和胜利的概率与AU玩家都基本持平,其中主动发起PVE的概率非常高,且二者的PVE胜率高达90%,游戏体验较好。

    感谢大佬的视频,学习完对SQL的印象加深了很多https://www.bilibili.com/video/BV1Nh411d7t3

    相关文章

      网友评论

          本文标题:互联网游戏数据分析(SQL)

          本文链接:https://www.haomeiwen.com/subject/geirjktx.html