1. 评估球队综合实力
在对球队进行预测或是进行数据分析的过程中,不可避免的要用到球队的综合实力,哪些指标对球队的综合实力起作用,又如何利用这些指标去转换成球队的综合实力分数,又或是利用某种方法去实现这种转换。于是,通过查阅论文资料,最终确定,运用TOPSIS法和秩和比法(RSR)通过对球队攻防能力的分析,来得到最终球队的综合评价。
数据分析流程图如下:
![](https://img.haomeiwen.com/i14961947/849c1ab3073edc5c.png)
4-2数据分析流程图
第一步指标选取:
一般在评价指标中会有高优指标和低优指标。低优指标即此类指标值越低越好,高优指标即指标值越高越好。用 TOPSIS 法进行评价时,要求所有指标变化方向一致,即所谓同趋势化。通常将低优指标转化为高优指标,转化可采用倒数法和差值法。为了有效评价球队进攻能力,本平台结合以往研究所采用的统计指标,选取 2 分命中率、3 分命中率、罚球命中率、进攻篮板、助攻、失误、得分等 8七项常用进攻技术统计作为研究对象。这些指标均为高优指标。选取抢断、防守篮板、封盖等3项指标来反映球队的防守质量。
![](https://img.haomeiwen.com/i14961947/9587ba920b084ce5.png)
第二步数据归一化处理
为了消除不同规则对评价结果的影响,使评价的多指标在同一个规则体系下进行比较,需对原始数据进行归一化处理,并建立相应矩阵。首先根据公式
![](https://img.haomeiwen.com/i14961947/213195ffed32c8b7.png)
(Xij 表示第 i 个评价对象在第 j 个指标上的取值)对各支球队的进攻与防守指标进行归一化处理。
![](https://img.haomeiwen.com/i14961947/a82a2317f03c5427.png)
第三步最优值向量与最劣值向量的确定:**
根据归一化矩阵得到最优值向量和最劣值向量,即有限方案中的最优方案和最劣方案为:
最优方案: A+=(a+i1, a+i2,…a+im) (各项最大值)
最劣方案: A-=(a-i1, a-i2,…a-im) (各项最小值)
其中, i=1,2,…, n; j=1,2,…, m。 a+ij 与 a-ij,分别表示现有评价对象在第 j 个评价指标上的最大值与最小值。
l 第四步计算诸评价对象与最优方案及最劣方案的距离,公式如下
![](https://img.haomeiwen.com/i14961947/5e1b1d8271cc7738.png)
其中, D +i 与 D -i 分别表示第 i 个评价对象与最优方案的距离; aij 表示某个评价对象在第 j 个指标的取值。根据公式可以计算诸评价对象与最优方案及最劣方案的距离。
l 第五步计算诸评价对象与最优方案的接近程度 Ci,公式如下
![](https://img.haomeiwen.com/i14961947/5d88478c52587e28.png)
Ci 在 0 与 1 之间取值,愈接近 1,表示该评价对象越接近最优水平;反之愈接近 0,表示该评价对象越接近最劣水平。根据公式可分别计算诸评价对象与最优方案的接近程度。 从中可以得到 CBA 各支俱乐部队的进攻与防守 C 值。
l 第六步各队综合实力排序
结合秩和比法对 CBA 篮球俱乐部攻守综合实力进行排序。首先将各支球队进攻与防守 C 值进行RSR 法综合评价。通过计算公式
RSR=Σ R/(m· n) 对研究指标进行计算得出攻防综合能力 RSR 值。
(Σ R表示某评价对象指标的秩和值, m 为评价指标的数目,n 为参赛队数)
最终经过对cba联赛一个赛季的数据进行分析,得到如下结果
![](https://img.haomeiwen.com/i14961947/a057ec5f00d2faec.png)
2.球队胜率预测
如何给用户在参与在线竞猜时提供实时,准确的主队和客队数据支持,本平台决定采用相应的算法,为用户在进行竞猜前,为主队和客队的比赛结果进行预测。
考虑到胜率和综合实力的连续性,初步判断为回归问题,于是决定采用构建线性回归模型的方式进行预测
l 构造训练集:
- 数据准备-球队赛季统计数据
![](https://img.haomeiwen.com/i14961947/41707599a887a937.png)
- 数据准备-球队综合评价RSR
![](https://img.haomeiwen.com/i14961947/29fa2d52eb027de1.png)
- 数据处理:
![](https://img.haomeiwen.com/i14961947/582d1e70cfa45de3.png)
![](https://img.haomeiwen.com/i14961947/ccb9cca237ffe3e8.png)
构建回归模型
我们最终要得到综合实力和胜率的具体对应关系,所以以RSR为自变量,以胜率y为因变量,表达式可以表示为
y=ax+b+e(其中e是随机误差,e满足正态分布)
将部分数据集以散点图表示为:
![](https://img.haomeiwen.com/i14961947/7c2158342ba036c0.png)
散点图
使用最小二乘法拟合
对于上面的样本集,尝试用y=ax+b+e进行拟合,可以得到
|e|=|ax+b-y|
可以看出,误差大小便是ax+b的值与y的差值,把所有的|e|都求和,得到函数
![](https://img.haomeiwen.com/i14961947/df75f955584ccacf.png)
即当Q最小,即可得到最佳拟合的直线。
该回归模型方程中a,b可以通过对函数进行求导得到,公式为:
![](https://img.haomeiwen.com/i14961947/997c6f478a95784c.png)
得到a,b后,可以用R的平方,即下面的公式评估拟合程度
![](https://img.haomeiwen.com/i14961947/4570154e6bb81bdc.png)
![](https://img.haomeiwen.com/i14961947/4af966ed719865be.png)
开始训练
将数据集以对象列表的方式导入到回归模型中
![](https://img.haomeiwen.com/i14961947/b34a60c4227b35a3.png)
获取回归模型,在模型中输入当前预测队伍的RSR,得到返回结果
![](https://img.haomeiwen.com/i14961947/e1204c15f8c9512c.png)
网友评论