1. 找到所有美股公司的股票代码
使用搜索引擎搜索下,就能搜索到某球网站
上所有的美股列表,https://xueqiu.com/S?exchange=US。
找到数据源之后,就可以使用客户端工具后羿采集器
(windows和mac版都有)来爬取所有我们想要的数据。
接下来打开客户端工具,开启点~点~点的爬取操作:
1)在输入框输入我们想要爬取的网站地址,https://xueqiu.com/S?exchange=US,然后点击智能采集
按钮
2)
智能采集
之后,就能在页面上看到软件自动分析识别了想要识别的数据image.png
3)点击
开始采集
按钮,就可以开启数据采集,采集完成之后就可以导出为csv文件
2. 根据美股公司股票代码抓取上市公司信息
1)根据股票代码,拼接出能展示美股信息的网址(使用同花顺网站),如:股票代号TSLA,对应的信息地址http://stockpage.10jqka.com.cn/TSLA/。
2)将拼接好的美股信息url保存为文件
image.png
3)打开后羿采集器
,继续点~点~点的操作,这次我们改用流程图模式
,比较简单
3)选择我们准备好的文件进行导入,点击立即创建
按钮
4)在页面上依次点击需要抓取的数据元素
image.png
5)抓取的股票信息、员工人数、净利润、营业额的字段如下
image.png
6)点击开始采集
按钮,就可以批量抓取需要爬取的字段内容
网友评论