1. 评估球队综合实力
在对球队进行预测或是进行数据分析的过程中,不可避免的要用到球队的综合实力,哪些指标对球队的综合实力起作用,又如何利用这些指标去转换成球队的综合实力分数,又或是利用某种方法去实现这种转换。于是,通过查阅论文资料,最终确定,运用TOPSIS法和秩和比法(RSR)通过对球队攻防能力的分析,来得到最终球队的综合评价。
数据分析流程图如下:
image.png4-2数据分析流程图
第一步指标选取:
一般在评价指标中会有高优指标和低优指标。低优指标即此类指标值越低越好,高优指标即指标值越高越好。用 TOPSIS 法进行评价时,要求所有指标变化方向一致,即所谓同趋势化。通常将低优指标转化为高优指标,转化可采用倒数法和差值法。为了有效评价球队进攻能力,本平台结合以往研究所采用的统计指标,选取 2 分命中率、3 分命中率、罚球命中率、进攻篮板、助攻、失误、得分等 8七项常用进攻技术统计作为研究对象。这些指标均为高优指标。选取抢断、防守篮板、封盖等3项指标来反映球队的防守质量。
image.png第二步数据归一化处理
为了消除不同规则对评价结果的影响,使评价的多指标在同一个规则体系下进行比较,需对原始数据进行归一化处理,并建立相应矩阵。首先根据公式
image.png(Xij 表示第 i 个评价对象在第 j 个指标上的取值)对各支球队的进攻与防守指标进行归一化处理。
image.png第三步最优值向量与最劣值向量的确定:**
根据归一化矩阵得到最优值向量和最劣值向量,即有限方案中的最优方案和最劣方案为:
最优方案: A+=(a+i1, a+i2,…a+im) (各项最大值)
最劣方案: A-=(a-i1, a-i2,…a-im) (各项最小值)
其中, i=1,2,…, n; j=1,2,…, m。 a+ij 与 a-ij,分别表示现有评价对象在第 j 个评价指标上的最大值与最小值。
l 第四步计算诸评价对象与最优方案及最劣方案的距离,公式如下
image.png其中, D +i 与 D -i 分别表示第 i 个评价对象与最优方案的距离; aij 表示某个评价对象在第 j 个指标的取值。根据公式可以计算诸评价对象与最优方案及最劣方案的距离。
l 第五步计算诸评价对象与最优方案的接近程度 Ci,公式如下
image.pngCi 在 0 与 1 之间取值,愈接近 1,表示该评价对象越接近最优水平;反之愈接近 0,表示该评价对象越接近最劣水平。根据公式可分别计算诸评价对象与最优方案的接近程度。 从中可以得到 CBA 各支俱乐部队的进攻与防守 C 值。
l 第六步各队综合实力排序
结合秩和比法对 CBA 篮球俱乐部攻守综合实力进行排序。首先将各支球队进攻与防守 C 值进行RSR 法综合评价。通过计算公式
RSR=Σ R/(m· n) 对研究指标进行计算得出攻防综合能力 RSR 值。
(Σ R表示某评价对象指标的秩和值, m 为评价指标的数目,n 为参赛队数)
最终经过对cba联赛一个赛季的数据进行分析,得到如下结果
image.png2.球队胜率预测
如何给用户在参与在线竞猜时提供实时,准确的主队和客队数据支持,本平台决定采用相应的算法,为用户在进行竞猜前,为主队和客队的比赛结果进行预测。
考虑到胜率和综合实力的连续性,初步判断为回归问题,于是决定采用构建线性回归模型的方式进行预测
l 构造训练集:
- 数据准备-球队赛季统计数据
- 数据准备-球队综合评价RSR
- 数据处理:
构建回归模型
我们最终要得到综合实力和胜率的具体对应关系,所以以RSR为自变量,以胜率y为因变量,表达式可以表示为
y=ax+b+e(其中e是随机误差,e满足正态分布)
将部分数据集以散点图表示为:
image.png散点图
使用最小二乘法拟合
对于上面的样本集,尝试用y=ax+b+e进行拟合,可以得到
|e|=|ax+b-y|
可以看出,误差大小便是ax+b的值与y的差值,把所有的|e|都求和,得到函数
image.png即当Q最小,即可得到最佳拟合的直线。
该回归模型方程中a,b可以通过对函数进行求导得到,公式为:
image.png得到a,b后,可以用R的平方,即下面的公式评估拟合程度
image.png 核心代码如下: image.png开始训练
将数据集以对象列表的方式导入到回归模型中
image.png
网友评论