美文网首页
基于深度强化学习的局内战斗自动化测试探索

基于深度强化学习的局内战斗自动化测试探索

作者: 行者AI | 来源:发表于2020-12-01 10:25 被阅读0次

    游戏项目研发时,期望搭建自动化测试平台,发现局内bug,避免重复劳动、提高测试效率以及避免人为的操作错误。其中环境要求使用项目需要使用Airtest、poco对接强化学习的服务器,实现Airtest将状态信息发送给服务器,服务器返回下一步的决策。

    1. 前期准备工作

    了解Airtest、poco、强化学习agent的决策方式。

    1.1 Airtest介绍

    Airtest基于图像识别的自动化测试框架。这个框架核心不在实现方式和技术上,而是理念!这个框架的理念借用是MIT(麻省理工)研究院的成果 Sikuli ,他们构思了一种全新的UI测试模式,基于图像识别控件而不是具体内存里的控件对象。

    Airtest特点

    ① 支持基于图像识别的可程式化测试工具
    ② 跨平台
    ③ 生成测试报告
    ④ 支持poco等SDK内嵌,提高UI识别精度

    Airtest界面(包含点击、滑动、判断、截屏等接口)

    Airtest局限性

    然而在实际工程中,图像不会一成不变,我们需要捕获项目的动态节点,针对动态节点进行点击、移动等操作(比如商店买旗子的位置节点)
    我们需要另一个工具Poco。

    1.2 Poco介绍

    目前Poco只支持原生Android和ios的接口调用,其他平台均需要接入对应平台的sdk

    Poco获取UI树的方式

    从根节点开始向下遍历子节点

    在unity项目中,需要在unity中安装Poco的SDK

    Poco调用方法

    Poco调用举例

    poco = UnityPoco()
    poco('btn_start').click()
    

    ① Airtest通过接口调用unity中的pocosdk,SDK对整个ui树进行遍历,将dump后的json信息传回Airtest。

    ② Airtest在得到的UI树中找到‘btn_start’的元素位置信息,通过adb进行点击操作。

    1.3 强化学习的简述

    Environment 通常利用马尔可夫过程来描述,Agent 通过采取某种 Policy 来产生Action,和 Environment 交互,产生一个 Reward。之后 Agent 根据 Reward 来调整优化当前的 Policy。

    用上图更形象的解释,state是环境的一个状态,observation是Agent观察到的环境状态,这里observation和state是一个意思。首先Agent观察到环境的一个状态,比如是一杯水,然后Agent采取了一个行为,这个行为是Agent把杯子中的水给打碎了,这样环境的的状态已经发生了变化,然后系统会对这个行为打一个分数,来告诉Agent这样的行为是否正确,然后根据新变化的环境状态,Agent再采取进一步的行为。Agent所追求的目标就是让Reward尽量的大。

    2. 项目执行过程:

    2.1 背景

    通过将训练好的一个Agent部署到服务器上,其他人通过访问服务器,流程如下:

    ① 测试端收集信息->测试端将信息转成约定好的state格式->测试端将state发给服务器->服务器返回一个Agent的决策->测试端收到信息执行决策->

    ② 测试端收集信息(新一轮循环的开始)...

    在这个过程中,测试端收集信息耗时最为严重,针对项目需求决定对其部分进行优化。

    2.2 具体问题

    ① poco首次调用dump接口时会启动大量mincap等诸多可执行文件,导致7秒左右的延迟。

    ② Airtest操作遇到的延迟过于严重,导致每回合可操作时间30秒内,只能进行4-5个动作。

    然而本地训练的agent后期每回合操作数能达到16个左右,导致后期agent动作不能完全在客户端上做完。

    2.3 解决方案

    ① 提前加载poco的click事件

    ② 定位到dump耗时严重,决定从sdk的接口出发,减少dump出的json文件大小。

    a. 在unity的接口中,加入tagfilter、blacklist、propertylist参数,来控制json的文件大小。
    其中tagfilter用于针对指定tag的unitygameobject的筛选,可以去除除UI和Default以外的所有物体。
    blacklist用于针对unitygameobject名字的筛选,能提高dump效率50%
    propertylist用于减少单个unitygameobject的参数写入,默认单个物体有10多个参数,筛选后可以省下6个左右的参数。可提高dump效率33%

    b. 在python的接口使用对应接口参数

    该方法完美解决了操作延迟的问题,目前客户端单回合30秒可以完成20个左右的动作。

    2.4 具体步骤:

    • layerfilter 在项目中,有13个layer。只对tag为UI和Default的UGO进行递归写入子节点信息,剔除掉场景、特效等层级,可以大幅减少开销。
    • namefilter 并非所有UI节点信息都是自动化测试需要获得的必要数据。所以在递归查询子节点时,遇到写入黑名单的UGO的名字时,可以减少约50%的时间开销。

    主要修改C#的poco中AbstractDumper中的dumpHierarchyImpl接口,具体如图:

    private Dictionary<string, object> dumpHierarchyImpl (AbstractNode node, bool onlyVisibleNode, Dictionary<string, object> extrapar)
    {
        if (node == null) 
        {
            return null;
        }
        Dictionary<string, object> payload = new Dictionary<string, object>();
        if (extrapar != null && extrapar.ContainsKey("param4") && extrapar["param4"] != null)
        {
            payload = node.enumerateAttrs(extrapar["param4"].ToString());
        }
        else
        {
            payload = node.enumerateAttrs(null);
        }
        Dictionary<string, object> result = new Dictionary<string, object> ();
        string name = (string)node.getAttr ("name");
    
        result.Add ("name", name);
        result.Add ("payload", payload);
        List<object> children = new List<object>();
        if (extrapar!= null)
        {
            if (extrapar.ContainsKey("param3") && extrapar["param3"] != null)
            {
                requirelayer = extrapar["param3"].ToString().Split('|').ToList();
                string layer = (string)node.getAttr("layer");
                if (!requirelayer.Contains(layer))
                {
                    //Debug.LogError("--dumpHierarchyImpl layer is not contains");
                    return result;
                }
            }
            if (extrapar.ContainsKey("param2") && extrapar["param2"] != null)
            {
                try
                {
                    filterlist.Clear();
                    string str = extrapar["param2"].ToString();
                    filterlist = str.Split('|').ToList();
                }
                catch
                {
                    Debug.LogError("~~~dumpHierarchy Implextrapar param2 error");
                }
    
                if (filterlist.Contains(name))
                {
                    return result;
                }
            }
        }
    
        foreach (AbstractNode child in node.getChildren()) 
        {
            if (!onlyVisibleNode || (bool)child.getAttr ("visible")) 
            {
             children.Add (dumpHierarchyImpl (child, onlyVisibleNode, extrapar));
            }
        }
        if (children.Count > 0) 
        {
            result.Add ("children", children);
        }
        return result;
      }
    
    • propertyfilter json默认dump出的一个节点参数包含:

    name、payload、type、visible、pos、size、scale、anchorPoint、zOrders、clickable、components、_ilayer、layer、_instanceId等参数。我们剔除掉了
    visible|scale|anchorPoint|clickable|components|_ilayer|layer|_instanceId实际上用不上的参数,大大减少的dump出来json的文件大小,可以减少约33%的时间开销。

    主要修改C#的poco中UnityNode中的enumerateAttrs、GetPayload接口,具体如下:

      private Dictionary<string, object> GetPayload(string blackList)
      {
            Dictionary<string, object> all =  new Dictionary<string, object>() {
                { "name", gameObject.name },
                { "type", GuessObjectTypeFromComponentNames (components) },
                { "visible", GameObjectVisible (renderer, components) },
                { "pos", GameObjectPosInScreen (objectPos, renderer, rectTransform, rect) },
                { "rawpos", GameObjectVec3Pos (objectRawPos) },
                { "rawrectpos", GameObjectVec3Pos (objectRectRawPos) },
                { "size", GameObjectSizeInScreen (rect, rectTransform) },
                { "scale", new List<float> (){ 1.0f, 1.0f } },
                { "anchorPoint", GameObjectAnchorInScreen (renderer, rect, objectPos) },
                { "zOrders", GameObjectzOrders () },
                { "clickable", GameObjectClickable (components) },
                { "text", GameObjectText () },
                { "components", components },
                { "texture", GetImageSourceTexture () },
                { "tag", GameObjectTag () },
                { "_ilayer", GameObjectLayer() },
                { "layer", GameObjectLayerName() },
                { "_instanceId", gameObject.GetInstanceID () },
            };
            Dictionary<string, object> payload = new Dictionary<string, object>();
            if (!string.IsNullOrEmpty(blackList))
            {
                List<string> black_list = blackList.Split('|').ToList();
                foreach(KeyValuePair<string, object> it in all)
                {
                    if(black_list.Contains(it.Key))
                    {
                        continue;
                    }
                    payload.Add(it.Key,it.Value);
                }
            }
            else
            {
                payload = all;
            }
    
            return payload;
      }
    

    我们是行者AI,我们在“AI+游戏”中不断前行。

    如果你也对游戏感兴趣,对AI充满好奇,那就快来加入我们吧~

    相关文章

      网友评论

          本文标题:基于深度强化学习的局内战斗自动化测试探索

          本文链接:https://www.haomeiwen.com/subject/wjijwktx.html