模拟百度搜索的HTTP请求:
(1)打开百度,在搜索框内输入“python”(或者其它内容)进行搜索。
百度搜索(3)对网址的结构进行分析:
http://www.baidu.com/s?字段名=字段值&字段名=字段值......
(4)简化网址后重新搜索验证:
http://www.baidu.com/s?ie=utf-8&wd=python
(5)编写代码:
自动模拟HTTP请求只需改动keywd的值就可以实现爬取指定搜索网页的功能。
模拟百度搜索的HTTP请求:
(1)打开百度,在搜索框内输入“python”(或者其它内容)进行搜索。
百度搜索(3)对网址的结构进行分析:
http://www.baidu.com/s?字段名=字段值&字段名=字段值......
(4)简化网址后重新搜索验证:
http://www.baidu.com/s?ie=utf-8&wd=python
(5)编写代码:
自动模拟HTTP请求只需改动keywd的值就可以实现爬取指定搜索网页的功能。
本文标题:「爬虫」03自动模拟HTTP请求
本文链接:https://www.haomeiwen.com/subject/fylkactx.html
网友评论