一 重定向
- (Redirect)就是通过各种方法将各种网络请求重新定个方向转到其它位置,从地址A跳转到地址B了。
2.重定向状态码:
--301 redirect: 301 代表永久性转移(Permanently Moved)
--302 redirect: 302 代表暂时性转移(Temporarily Moved )
二 禁止重定向
对于一个网站,使用requests库直接访问:r = requests.get(url, headers = kv)
如果该网站发生了重定向,可能不会显示出来,返回码r.status_code = 200
,因为requets库自动处理了重定向请求,如果网站在不断重定向,则会发生Python Requests: requests.exceptions.TooManyRedirects: Exceeded 30 redirects的问题,可以设置一个参数禁止重定向:allow_redirects=False
(默认allow_redirects=True
是启动重定向),然后就可以看到status_code是302了,然后使用r.headers["Location"]
返回重定向的网址
# coding:utf-8
import requests
kv = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0"}
r = requests.get(url, headers = kv, allow_redirects=False)
print r.status_code
new_url = r.headers["Location"]
网友评论