参考:
二项回归:http://blog.sina.com.cn/s/blog_44befaf601015pqu.html
知乎聚类分析绝地求生玩家行为: https://zhuanlan.zhihu.com/p/30172493
Kmeans: http://blog.csdn.net/h66295112/article/details/52953580
异方差: https://wenku.baidu.com/view/527842c7a1c7aa00b52acb0a.html
爬取数据
- 爬取数据:爬取 https://pubg.me/上的各服务器前百名数据。
- 分析:分析爬取到数据的内容,选择合适的特征参数。
导入数据
打开SPSS导入excel文件,在导入之前已经对excel文件进行处理,将所有元素转成数字型,否则导入SPSS时有些数据将不能显示

数据变量说明
name | site |
---|---|
WinRate | 胜率 |
KDA | (击杀数 / 死亡数) |
Headshot Kill Ratio | 爆头率 |
Top10Rate | 前10率 |
AVG Survival Time | 平均生存时间 |
AVG Distance On Foot | 平均步行距离 |
AVG Distance In Vehicle | 平均载具行驶距离 |

先做一个散点图观察

然后进行聚类


迭代29次时收敛


用python作图更直观看出
相关分析
xxxxxx
xxxxxx
回归分析
标准化


回归分析的基本步骤
(1)确定自变量和因变量(父亲身高关于儿子身高的回归与儿子身高关于父亲身高的回归是不同的).
(2)从样本数据出发确定变量之间的数学关系式,并对回归方程的各个参数进行估计.
(3)对回归方程进行各种统计检验.
(4)利用回归方程进行预测.
-
一元回归方程
(一)一元回归方程:
E(y)=β0+β1x
β0为常数项;β1为y对x回归系数,即:x每变动一个单位所引起的y的平均变动
(二)一元回归分析的步骤
利用样本数据建立回归方程
回归方程的拟和优度检验
回归方程的显著性检验(t检验和F检验)
残差分析
预测
(三)残差序列独立性检验:
残差序列是否存在后期值与前期值相关的现象,利用D.W(Durbin-Watson)检验
d-w=0:残差序列存在完全正自相关;d-w=4:残差序列存在完全负自相关;0<d-w<2:残差序列存在某种程度的正自相关;2<d-w<4:残差序列存在某种程度的负自相关;d-w=2:残差序列不存在自相关.
残差序列不存在自相关,可以认为回归方程基本概括了因变量的变化;否则,认为可能一些与因变量相关的因素没有引入回归方程或回归模型不合适或滞后性周期性的影响.
name | xxx |
---|---|
ZPRED | 标准化的预测量 |
ZRESID | 标准化的残差 |
DRESID | 删除的残差 |
ADJPRED | 修正后的预测值 |
我们把所有变量都加入



经过分析后,(多重共线性),我们剔除top10


网友评论