一、数据概览
数据共有828934条,108列标签
本文主要对以下10个字段进行分析
使用工具:Navicat Premium ,jupyter notebook
技能要求:SQL掌握到子查询,Python连接数据库(不连也可以)
二、提出问题:
1、新增玩家分析:从玩家数量、玩家占比、每日新增玩家数展开分析
2、玩家活跃度分析:从不同用户在线时长、分布特征展开分析
3、玩家付费情况分析:从PUR(付费比率)、ARPPU(活跃付费用户平均消费金额)等关键指标展开分析
4、玩家游戏习惯分析:从不同玩家类型、游戏模式(PVP与PVE)得出的情况来展开分析
三、新增玩家分析
新增玩家数量:828934人
SELECT count(DISTINCT user_id) 新增玩家数量 FROM `tap_fun_test`
新增付费玩家数量:19549
select count(DISTINCT(user_id)) 新增付费玩家数量 from tap_fun_test where pay_price >0;
付费玩家占比:0.0236
select 新增付费玩家/新增玩家数 as 付费玩家占比 from
(SELECT count(distinct user_id) 新增玩家数 from tap_fun_test) as t1 ,
(SELECT count(DISTINCT user_id) 新增付费玩家 from tap_fun_test where pay_price>0) as t2 ;
每日新增用户数量
select date(register_time) 日期,count(DISTINCT(user_id)) from tap_fun_test GROUP BY 日期;
每日新增付费用户数
select date(register_time) 日期,count(DISTINCT(user_id)) from tap_fun_test where pay_price>0 GROUP BY 日期;
每日新增玩家在3月10日有一次大高峰增长,可能举办活动,但活动一过后续新增玩家数并没有显著提升,可见活动没有游戏的人气带来实质性的帮助。
活动需要力度加强并保持一定时间维度,给玩家充分时间了解游戏,才能提高秀逸热度。
全部玩家平均在线时长:11.741103057664969
SELECT avg(avg_online_minutes) as 全部玩家平均在线时长 from tap_fun_test;
付费玩家平均在线时长:135.8732415946089
select avg(avg_online_minutes) from tap_fun_test where pay_price>0;
四、玩家活跃度分析
平均在线时长的分布特点
全部玩家人数的中位数、上下四分位数
select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2) as 中位数,
round(count(distinct user_id)/4*3) as 上四分位数
from tap_fun_test;
下四分位数:207234 中位数:414467 上四分位数:621701
全部玩家在线时长箱线图关键值
SELECT min(avg_online_minutes) 最小值,
(select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 207233,1) as 下四分位数,
(select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 414466,1) as 中位数,
(select avg_online_minutes from tap_fun_test ORDER BY avg_online_minutes LIMIT 621700,1) as 上四分位数,
max( avg_online_minutes) 最大值
FROM `tap_fun_test`
最小值0.0,下四分位数:0.5,中位数:1.666667,上四分位数:5,最大值:1605.833333
付费玩家的人数最大值最小值、中位数、上下四分位数
select round(count(distinct user_id)/4) as 下四分位数,
round(count(distinct user_id)/2) as 中位数,
round(count(distinct user_id)/4*3) as 上四分位数
from tap_fun_test
WHERE pay_price>0;
下四分位数:4887, 中位数:9775 上四分位数:14662
付费玩家在线时长箱线图关键值
SELECT min(avg_online_minutes) 最小值,
(select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 4886,1) as 下四分位数,
(select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 9774,1) as 中位数,
(select avg_online_minutes from tap_fun_test where pay_price>0 ORDER BY avg_online_minutes LIMIT 14661,1) as 上四分位数,
max( avg_online_minutes) 最大值
FROM `tap_fun_test`
where pay_price>0;
最小值:0.3333 ,下四分位数:30.6667,中位数:84.5,上四分位数:191.1667,最大值:1081.5
全部玩家的在线时长箱线图中向下压缩的很厉害,全部玩家上四分位数为5,说明75%的玩家平均在线只有大约5分钟,可能一局游戏都没有玩完,可见玩家流失情况比较严重。
付费用户的箱型图中下四分位数为30,中位数84,上四分位数为191,说明付费用户中75%以上的用户在线时长都超过了30分钟。
五、玩家付费情况分析
关键指标
AU(active users)活跃用户:游戏时长超过15分钟
PU(Paying users)付费用户
APA(Active Paying Account):活跃付费用户数
ARPU:平均每个活跃用户的收入,总收入/AU
ARPPU:平均活跃付费用户收入,总收入/APU
PUR(付费比率):APA/AU
每个活跃玩家的收入
select count(DISTINCT user_id) as AU,
(select sum(pay_price) from tap_fun_test as 总收入),
(select sum(pay_price) from tap_fun_test) /count(DISTINCT user_id) as 每个活跃玩家收入
from tap_fun_test
where avg_online_minutes > 15;
#and pay_price>0;每个活跃付费玩家的收入
AU:99846,总收入:556900.04,每个活跃玩家收入ARPU:5.57758989
每个活跃付费玩家的收入
APA:16982,总收入:556900.04,每个活跃付费玩家收入ARPPU:32.79354846
付费比率
select count(DISTINCT user_id) as APA ,
(SELECT count(DISTINCT user_id) from tap_fun_test WHERE avg_online_minutes>=15) as AU ,
count(DISTINCT user_id)/(select count(DISTINCT user_id) from tap_fun_test
where avg_online_minutes>=15) as PUR
from tap_fun_test
where avg_online_minutes>=15 and pay_price >0;
APA:17005;AU:100649;活跃玩家的付费率PUR:0.169,全部玩家的付费比率:0.021
该游戏的PUR(人均付费率)为0.169较低,且ARPU(活跃玩家平均消费额)为5.58,说明收入表现差;相对于ARPPU,活跃付费用户消费很高,是ARPU的6倍左右,针对这点我们可以做首次消费门槛和专属大V玩家的福利与活动进行调整与优化。
六、玩家游戏习惯分析
select AVG(pvp_battle_count) as 平均PVP次数 ,
sum(pvp_lanch_count)/sum(pvp_battle_count) as 主动发起PVP概率,
sum(pvp_win_count)/sum(pvp_battle_count) as PVP获胜概率
from tap_fun_test
where avg_online_minutes>=15;
PVP活跃玩家
平均PVP次数:15.164651412333953;主动发起PVP概率:0.5688357584679884;PVP获胜概率:0.532222547626395
PVP活跃付费玩家(加一个pay_price>0)
平均PVP次数:27.301911202587473;主动发起PVP概率:0.6553937480210826;PVP获胜概率:0.6872459716242092
PVE活跃玩家
平均PVE次数:28;主动发起PVE概率:0.9967;PVE获胜概率:0.9041
PVE活跃付费玩家
平均PVE次数:52;主动发起PVE概率:0.9957;PVE获胜概率:0.9110
APA(付费活跃用户)玩家的平均PVE和PVP次数都是AU(活跃)玩家次数的两倍左右,显然APA玩家是重要的发展对象。
PVP活动中,APA玩家主动发起和胜利的概率都明显高于AU玩家。
PVE活动中,APA玩家主动发起和胜利的概率与AU玩家都基本持平,其中主动发起PVE的概率非常高,且二者的PVE胜率高达90%,游戏体验较好。
感谢大佬的视频,学习完对SQL的印象加深了很多https://www.bilibili.com/video/BV1Nh411d7t3
网友评论