把英雄分类，看 Python 带你轻松上王者！

作者: 14e61d025165 | 来源:发表于2019-03-16 14:22 被阅读0次

把英雄分类，看 Python 带你轻松上王者！
把英雄分类，看 Python 带你上王者
把英雄分类，看 Python 带你上王者！
把英雄分类，看 Python 带你上王者
克制
王者荣耀：选这些英雄分分钟带你上王者
头脑王者利用Charles+Python轻松上王者
王者荣耀之大神
王者荣耀基情演绎卡之家带你看英雄CP
技术支持

王者荣耀这么久了，还没上王者？哈哈哈，看过来，是不是对英雄理解的不够透彻呢，是不是还没有很好的为英雄分类呢，今天就来看看英雄分类

技术栈

欢迎大家加入小编创建的Python行业交流群，有大牛答疑，有资源共享，有企业招人！是一个非常不错的交流基地！群号：683380553

一、EM 聚类简介

二、爬取网上的英雄初始属性值

三、做成饼图

EM 聚类简介

EM 英文名是 Expectation Maximization，也叫最大期望算法。

在统计计算中，最大期望（EM）算法是在概率（probabilistic）模型中寻找参数最大似然估计或者最大后验估计的算法，其中概率模型依赖于无法观测的隐藏变量（Latent Variable）。

最大期望算法经过两个步骤交替进行计算，第一步是计算期望（E），利用对隐藏变量的现有估计值，计算其最大似然估计值；第二步是最大化（M），最大化在 E 步上求得的最大似然值来计算参数的值。M 步上找到的参数估计值被用于下一个 E 步计算中，这个过程不断交替进行。

进行英雄聚类

使用 sklearn 库中的的 EM 聚类算法框架，采用高斯混合模型

1from sklearn.mixture import GaussianMixture

一些主要参数意义如下，其他参数可以查看相关文档

n_components:混合高斯模型个数，也就是想要的聚类个数，默认为1

covariance_type:协方差类型，包括{‘full’,‘tied’, ‘diag’, ‘spherical’}四种，分别对应完全协方差矩阵（元素都不为零），相同的完全协方差矩阵（HMM会用到），对角协方差矩阵（非对角为零，对角不为零），球面协方差矩阵（非对角为零，对角完全相同，球面特性），默认‘full’ 完全协方差矩阵

max_iter:最大迭代次数，默认100

所以可以构造 GMM 聚类如下：

1# 构造 GMM 聚类

2gmm = GaussianMixture(n_components=20, covariance_type='full')

有一份如下结构的数据：

可以看到，涉及到的属性非常多，初始的属性设置如下：

1feature = ['1级物理攻击','15级物理攻击','每级成长',

2'1级生命','15级生命','生命成长值','1级物理防御',

3'15级物理防御','每级物理防御成长','攻速成长',

4'1级每5秒回血','15级每5秒回血','1级最大法力',

5'15级最大法力','最大法力成长','1级每五秒回蓝',

6'15级每5秒回蓝','近/远程？','移速','定位','个人建议分路']

属性降维

可以先通过热力图来判断下哪些属性是强相关的，只保留唯一属性

1importseabornassns

2importmatplotlib.pyplotasplt

3

4corr = data[feature].corr()

5plt.figure(figsize=(14,14))

6sns.heatmap(corr, annot=True)

7plt.show()

可以看到，其中”1级最大法力“，”15级最大法力“，”最大法力成长“，是强相关的，由此可以做出属性筛选，最终保留的属性如下：

1features_remain = ['15级生命','15级物理攻击',

2'15级物理防御','15级最大法力',

3'15级每5秒回血','15级每5秒回蓝','移速',

4'攻速成长','近/远程？']

数据规范化

将攻击范围字段（”近/远程？“）转换为 0 和 1

1data_new['近/远程？'] = data_new['近/远程？'].map({'远程':1,'近程':0})

EM 聚类计算

采用高斯混合模式，并把生成的类别写入 csv 文件中

1# 构造 GMM 聚类

2gmm = GaussianMixture(n_components=20, covariance_type='full')

3gmm.fit(data_new)

4

5# 训练数据

6prediction = gmm.predict(data_new)

7# print(prediction)

8

9hero_data.insert(0,'分组', prediction)

10hero_data.to_csv('hero_out.csv', index=False, sep=',', encoding='gb18030')

饼图输出

为了更加直观的查看各个英雄的分组情况，这里使用饼图来做可视化

首先取出数据的”分组“和”名称“两个字段，并对”分组“字段进行分组处理

1df = hero_data[['分组','名称']]

2grouped = df.groupby(['分组'])

然后取出分组中的数值，并用 pyecharts 来画饼图

1frompyechartsimportPie

2

3k = []

4forname, groupingrouped:

5k.append({name: list(group['名称'].values)})

6

7kk = []

8foriink:

9fork, vini.items():

10kk.append(v)

11

12length = []

13key = []

14foriinkk:

15key.append(str(i))

16length.append(len(i))

17pie = Pie('英雄完全属性分类图', title_pos='center')

18pie.add("", key, length,

19is_label_show=True, legend_pos="bottom", legend_orient="vertical",)

20pie.render()

抓取英雄初始属性

要想获得更加全的英雄数据，还是需要到网上抓取，这样才能够保证英雄的数量是最新的。这里我使用的是 http://db.18183.com/ 网站的数据，页面如下：

获取英雄页面 URL

使用 BeautifulSoup 来定位到 class 为 mod-iconlist 的 ul 元素，里面保存的就是各个英雄的页面

1url ='http://db.18183.com/'

2url_list = []

3res = requests.get(url +'wzry').text

4content = BeautifulSoup(res,"html.parser")

5ul = content.find('ul', attrs={'class':"mod-iconlist"})

6hero_url = ul.find_all('a')

7foriinhero_url:

8url_list.append(i['href'])

抓取详细信息

循环抓取到的 URL 列表，抓取每个英雄的详细信息

1base_url ='http://db.18183.com/'

2detail_list = []

3foriinurl:

4# print(i)

5res = requests.get(base_url + i).text

6content = BeautifulSoup(res,"html.parser")

7name_box = content.find('div', attrs={'class':'name-box'})

8name = name_box.h1.text

9hero_attr = content.find('div', attrs={'class':'attr-list'})

10attr_star = hero_attr.find_all('span')

11survivability = attr_star[0]['class'][1].split('-')[1]

12attack_damage = attr_star[1]['class'][1].split('-')[1]

13skill_effect = attr_star[2]['class'][1].split('-')[1]

14getting_started = attr_star[3]['class'][1].split('-')[1]

15details = content.find('div', attrs={'class':'otherinfo-datapanel'})

16# print(details)

17attrs = details.find_all('p')

18attr_list = []

19forattrinattrs:

20attr_list.append(attr.text.split('：')[1].strip())

21detail_list.append([name, survivability, attack_damage,

22skill_effect, getting_started, attr_list])

保存到 csv 文件

open 一个文件，把对应的列表字段存入

1withopen('all_hero_init_attr.csv','w', encoding='gb18030')asf:

2f.write('英雄名字,生存能力,攻击伤害,技能效果,上手难度,最大生命,最大法力,物理攻击,'

3'法术攻击,物理防御,物理减伤率,法术防御,法术减伤率,移速,物理护甲穿透,法术护甲穿透,攻速加成,暴击几率,'

4'暴击效果,物理吸血,法术吸血,冷却缩减,攻击范围,韧性,生命回复,法力回复\n')

5foriindetails:

6try:

7rowcsv ='{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{},{}'.format(

8i[0], i[1], i[2], i[3], i[4], i[5][0], i[5][1], i[5][2], i[5][3], i[5][4], i[5][5],

9i[5][6], i[5][7], i[5][8], i[5][9], i[5][10], i[5][11], i[5][12], i[5][13], i[5][14], i[5][15],

10i[5][16], i[5][17], i[5][18], i[5][19], i[5][20]

11)

12f.write(rowcsv)

13f.write('\n')

14except:

15continue

数据清理

因为这个网站可能做的不是很用心，有些属性会存在两个百分号和为空的情况，如图：

所以需要处理下。

对于两个百分号，直接使用 notepad++ 把所有的 %% 的替换为单 % 即可

对于为空的字段，使用如下代码处理，填为 0

1# 把空值设置为0

2data_init = data_init.fillna(0)

完成

对于数据规范化，GMM 聚类和饼图呈现，都和前面类似，不再赘述，下面来看看饼图效果

虽然通过这两张饼图，没有办法一下子提高你手残的毛病，但是明确了英雄的分类，不是离王者更近了一步吗

网友评论

本文标题：把英雄分类，看 Python 带你轻松上王者！

本文链接：https://www.haomeiwen.com/subject/jyqsmqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

把英雄分类，看 Python 带你轻松上王者！

相关文章