美文网首页机器学习小白修炼营之RPA机器学习和人工智能入门
UiPath基础篇 - 文本自动化2(结构化数据抓取)

UiPath基础篇 - 文本自动化2(结构化数据抓取)

作者: 哈皮小白 | 来源:发表于2019-08-09 23:00 被阅读7次

    在之前的分享中(UiPath基础篇 - 文本自动化1),小白带大家了解了一下关于文本自动化的一些activity,但不知道小伙伴们还记不记得其中还遗留了一项 -Extract Structured Data

    这个activity是用来做什么的呢?我个人认为这是UiPath一个非常实用的功能,它可以实现对桌面或Web应用程序上结构化的数据,通过简单的向导,导出数据表。

    所以小白决定拿一个官网的实例为大家介绍一下这个activity的具体使用。

    假设你是一家体育用品供应商,你有兴趣定期在网上了解排球的最新价格。你可以通过UiPath这样来帮助你:

    1. 打开IE浏览器,导航到www.amazon.com(官方例子中使用的是亚马逊,当然实际可以换用其它网上商城)。

    2. 在搜索框中,输入排球并按回车将结果显示在网页上。

    3. 点击Data Scraping,显示Extract Wizard,这个是帮助我们将抓取的数据转成需要的结构的向导。

    4. 点击Next,选择网页上显示的所有排球名称的第一项和最后一项。然后会显示Configure Columns(列设置)向导。

    5. 如果这个时候我们勾选Extract URL复选框还可以导出相应项的链接。

    6. 根据需要修改列标题的名称。

    7. 点击Next将显示当前数据的预览,之前所选的字段也会在网页上突出显示。

    8. 如果还需要抓取其它数据的话这个时候可以点击Extract Correlated Data,向导会再次显示Extract Wizard窗口。

    9. 我们可以参照添加排球名称的方式添加排球的价格,然后再进入Configure Columns

    10. 更改新列的名称,单击Next,显示数据预览。

    11. 可以通过拖动列的位置来更改列的顺序,抓取数据的最大条数也可以在这里修改。

    12. 点击Finish,将显示Indicate Next Link窗口,提示你还可以跨多个页面抓取数据。

    13. 这时候,抓取的数据表变量ExtractDataTable已经自动生成。

    14. 在Data Scraping后添加一个Workbook的Write Range,把我们抓取的数据表写到某个Excel内。

    15. 打开Excel,确认所有列都已正确填充,大功告成!

    是不是非常简单呢?大家可以亲自动手尝试一下,类似的操作在以前分享的RPA实验室 - 航班数据自动抓取中也有涉及,可用来参考。

    同学们有任何问题或建议都可以通过以下二维码或搜索微信公众号小白修炼营之RPA UiPath找到我们。当然你也可以直接加入我们小白修炼营的QQ群,和小伙伴们随时随地一起聊RPA。

    相关文章

      网友评论

        本文标题:UiPath基础篇 - 文本自动化2(结构化数据抓取)

        本文链接:https://www.haomeiwen.com/subject/ppvkjctx.html