2018年时,我写过一个Python程序,从中国银行网站定期爬取外汇牌价,当时花了挺多时间来分析数据在html网页中存放的结构。
据说用RPA来实现此类需求会更简单,今天就来试一下。
-
首先找到中国银行网站外汇牌价数据查询页面:
https://www.boc.cn/sourcedb/whpj/ -
然后启动UiPath Studio,新建一个空白流程并命名为"爬取外汇牌价"。

-
点击“数据抓取”启动向导,并点下一步开始。
image.png
-
按向导提示点击一个数据表格单元,并确认从整个表格中提取数据。


-
向导提示数据预览。
image.png
-
点击预览页面上完成按钮后,提示是否指示下一页按钮。


- 向导完成后,在首页生成一个数据抓取的流程节点。

- 将此节点与Start节点关联,并点开明细查看。

-
点击调试文件,确认流程没有问题。
image.png
-
将数据抓取结果写入Excel文件。


-
输出Excel结果如下。
image.png
网友评论