英雄联盟(League of Lengends,LoL)是一款几乎众所周知的MOBA在线竞技游戏了,游戏具有很强的可玩性和竞技性,以及,可量化性——玩家们常常使用量化的数据作为互相交流与能力评估的依据。
最近我和另外两个小伙伴刚开始一个英雄联盟(LoL)数据挖掘小项目,计划主要使用Riot Games的官方REST API来获取数据(除了国服和台服无法通过此接口获取,美欧韩之类的全部都可以)。Riot Games的官方开发者论坛上给出了一个第三方库列表,主要是使用各种语言编写的wrapper。因为我们打算使用Python来做,所以只看了Python的几个库,目前觉得这个相对较好、方法较全:Cassiopeia,基于Python 3.x(通过使用future模块,2.7也是可以用的哦)。
以下我对一些API中出现的游戏术语做了翻译,对可能用到的一些GET方法做了简要说明,最后简单分析了下API的方便程度。
游戏术语翻译
- Champion - 英雄角色
- Summoner - 玩家
- Rune - 符文
- Mastery -天赋
- Game / Match - 游戏局、比赛,两词无本质区别
- Item - 物品/装备
- Team - 战队
- League - 排位战区,如:希维尔的狩猎领域039
- Spell - 召唤师技能
- Event - 事件,如击杀、推塔、杀怪
- Point - 事件发生坐标
- (Sight) Wards - 视野道具
API Methods
- champion
英雄的基本状态,如在各模式中是否可用 - current-game
某一玩家当前进行的比赛中的基本数据(不包含游戏开始后的过程数据如击杀) - featured-game
推荐观战的一组比赛的基本数据(不包含游戏开始后的过程数据如击杀) - game
某一玩家最近10场比赛的详细数据 - lol-static-data
英雄属性、英雄技能、物品属性、物品价格、符文、天赋的静态数据 - match
某一场比赛(match)的详细数据(包含初始数据及过程数据如击杀、物品、金钱、协助或击杀某大型野怪或防御塔数量、某次击杀或推塔事件中击杀/被击杀/参与的玩家id)。因为该方法涉及内容较多,这里列下里面涉及的数据对象:
MatchDetail, Participant, ParticipantIdentity, Team, Timeline, Mastery, ParticipantStats, ParticipantTimeline, Rune, Player, BannedChampion, Frame, ParticipantTimelineData, Event, ParticipantFrame, Position - matchlist
某一玩家在某一区域、某一赛季的列表数据(还可根据比赛时间与序号iinde做筛选,注意序号与时间并非完全正相关) - stats
/ranked: 某一玩家在某一赛季使用各英雄的比赛统计数据
/summary: 某一玩家在某一赛季各模式下的比赛统计数据 - summoner/...
玩家的头像、等级、天赋、符文设置 - team
战队的成员信息、历史对抗数据、历史胜负统计数据
简单分析
可以看到,大部分Method返回的都是基于某一个具体玩家的数据,如果只是做一个基本的游戏数据查询应用,目前的API已经是足以胜任的。但是一旦我们需要进行更深层次的分析,比如某一个英雄在某一段位、某一时间段内的胜率,那么API里没有一个可以直接获取大量比赛数据的Method。但这并非说明完全做不到,一种可行的策略是通过一次比赛获得参加该比赛玩家的数据,再通过玩家数据获取更多比赛数据,逐步累积出一个够大的数据集。不过由于一个玩家的水平是一定的,不大可能通过单个玩家得到各个层次的比赛数据,所以需要多个来自不同段位的种子玩家。更多细节在此就忽略了,我们仍然有许多问题有待进一步考虑。
现在许多第三方的LoL应用都涉及英雄的win rate、ban rate之类的数据,但我们想做的不是这种简单的统计,而是挖掘。后续我应该会把一些分析结果也放上来。
Update: 项目Github传送门(目前已做好数据获取部分,一些基本的统计/机器学习方法也有所尝试)
网友评论