美文网首页
AutomationAnywhere实现发票查验

AutomationAnywhere实现发票查验

作者: 聪明熊猫 | 来源:发表于2019-07-18 11:33 被阅读0次

    发票查验的自动化

    ​RPA伊始便是从财务流程入手,把繁琐的操作/数据处理计算/整理归档等工作,高速高效的完成。其中针对发票的查验,勾选,报销等流程,则作为财务RPA流程的标准样例,广为流传。

    本篇将简要介绍发票查验的RPA技术实现。

    传统发票查验主要有2个途径:

        1是通过第三服务接口或整合平台,查验发票真伪和全票面数据。其优点是速度快,但需要收费,发票信息数据或有延迟。

        2是登陆税局查验平台,输入发票的基本信息。在此公共平台上,手工查验发票信息,人工进行核对。其优点是免费, 但速度慢,且网站内的验证码辨识较难。

    这其中,验证码的识别也有不同的处理方法。比如:

        1.简单的就用OCR识别。最早期的验证码是4-6位的英文或字母。自然再简单不过,OCR小试牛刀,就可以迎刃而解。

        2.抠图拖拽的,一个简单的算法就可以计算出2点间距离,鼠标拖拽也就不麻烦了。

        3.或有高手,解析验证码算法,抓取数据包进行破解,也未尝不可。只是门槛太高,验证码编码算法经常变动或升级,解析也就越发困难了。

        4.加之汉语文字,语意,相似照片,混淆信息干扰等众多因素,验证码的识别似比登天。虽然相关的机器学习的算法较成熟,但训练的投入成本太高,没人愿意为之买单。

    第三方打码服务的出现,解决了之前的众多困扰因素。 速度较快,收费低,性价比高。

    下面一个视频,就是RPA调用第三方服务,识别验证码的简要演示。

    视频。上传审核中,稍后更新。

    本例中,主要是使用VBS做了图片的读取和BASE64编码,然后调用第三方服务获取验证码结果,最后回传RPA工具。对于有开发背景,对RPA工具不熟悉的人员适用。

    回归正题,企业或客户,根据自身需求和现有系统状况,会有所选择。 考虑成本的原因,不少企业都会选择第二种发票查验的方法,登录税局网站免费查验。

    之前接触过用python或Uipath完成此功能的实现,或也用AA加以修改。但总归是各尽其责,功能分散。无法做好整合和维护。

    偶有机会用AA尝试完成其主要功能,进行了验证。颇有感触。

    原来实现起来这么容易,全部功能一共才30+行脚本。(仅完成正常系流程,异常处理后续在补充)

    永远别认为产品就这些功能,或者自己已经掌握其之八九。就如EXCEL几乎人人会用。 但其深似海,又有几人敢说用的好。

        3. 没有能不能做。

    干货

    1. 输入数据:电子发票PDF文件。(纸质扫描的情况,另做讨论) 主要读取发票关键信息。AA里自带PDF的功能,便可及其简单的完成此功能。一条命令,便可完成票面上众多信息。也可与其他文件夹功能组合,做批量文件的识别与信息获取。

    2. 页面的录入:AA中的"万能选手"Object Cloning担当此重任。秒秒钟搞定。

    3. 第三方打码服务: 直接调用接口API即可。 只是回馈时间需要几秒钟。毕竟这么难以辨识的图片,让后台打码的客服也是心力憔悴。

    4. 全票面信息获取。

        之前听说RPA工具抓取页面信息有困难。真相还是要自己去尝试。 虽然没有万能的工具,抓不到页面元素,但我们可以看看页面背后的东西。自然也就能得到自己想要的东西了。  说白了,就是要自己看看html了,自己找元素ID,index了。

    30+多行脚本完成了主要功能,简单且有小小的成就感。

    5. 视频。

    上传审核中,稍后更新。

    相关文章

      网友评论

          本文标题:AutomationAnywhere实现发票查验

          本文链接:https://www.haomeiwen.com/subject/eabklctx.html