数据抓取使您能够将结构化数据从浏览器、应用程序或文档中提取到数据库、.csv 文件甚至 Excel 电子表格中。
注意: 建议您在 InternetExplorer 11 及以上、MozillaFirefox 50 或更高版本或最新版本的 Google Chrome上运行 web 自动化。
结构化数据是一种高度组织化的信息,以一种可预测的模式呈现。例如,所有的 Google 搜索结果都有相同的结构:顶部的链接、URL 字符串和网页的描述。这种结构使 Studio 能够轻松地提取信息,因为它总是知道在哪里找到它。
可以从Design 选项卡单击 Data Scraping 按钮打开 Extract Wizard。
Extract Wizard数据抓取向导的主要步骤是:
- 选择要从中提取数据的网页、文档或应用程序中的第一个和最后一个字段,以便 Studio 可以推断信息的模式。
表格预览注意: Studio 自动检测您是否指向了表单元格,并询问您是否要提取整个表。如果您单击 Yes,则提取向导将显示所选表数据的预览。
- 定制列标题并选择是否提取URL。
- 预览数据,编辑要提取的最大结果数,并更改列的顺序。
-
可选地单击 Extract Correlated Data。这使您能够再次查看提取向导,提取其他信息并将其作为新列添加到同一个表中。
-
指出网页、应用程序或文档中的 Next 按钮(如果要提取的信息跨越多个页面)。
完成向导后,将在studio中生成项目。
生成的程序框图数据抓取总是生成一个容器 (Attach Browser 或 Attach Window ),其中一个用于顶层窗口的选择器和一个带有部分选择器的 Extract Structured Data 活动,从而确保正确识别要抓取的应用程序。
此外, Extract Structured Data活动还附带一个自动生成的 XML 字符串(在 Extract Meta data 属性中),该字符串指示要提取的数据。
最后,所有已抓取的信息都存储在一个 DataTable 类型 的变量中,您可以接着使用该变量填充数据库、.csv 文件或 Excel 电子表格。
更多 UiPath 相关的资讯,请关注公众号:UiPath教程
由于简书禁止直接在文章中插入公众号二维码,请点击 这里 了解添加该公众号的细节。
网友评论