Python爬虫（四）发送带Headers的请求

作者: 咸甜怪 | 来源:发表于2019-06-07 12:19 被阅读0次

Python爬虫（四）发送带Headers的请求
9. requests模块
python 爬虫必备工具箱之----Headers参数一键转换
常见的反爬虫和应对方法
python3-urllib.request操作
爬虫学习(2)—Python requests库
用Python玩爬虫，首先得有一个流程，这个流程最适合小白用！
用Python玩爬虫，首先得有一个流程，这个流程最适合小白用！
scrapy发送post请求进行登录
想要玩爬虫！正则表达式是你的必修课程！这篇足以你玩转爬虫了！

如果你尝试了我在Python爬虫（二）Requests库题中讲述的response方式，发现有可能会获取不到网页源码（登陆知乎一定可以获取不到）。

不带headers的requests.get.png 这是因为什么？之前的文章里讲过，有很多网站为了防止爬虫程序爬网站造成网站瘫痪，所以我们的程序在模拟浏览器访问这些网站时，需要携带一些headers头部信息才能访问，最常见的有User-Agent、referer、cookie参数。
写一个简单的例子：

import requests
url = 'https://www.zhihu.com.'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36'}
response = requests.get(url, headers=headers)
# response.encoding = 'utf-8'
print(response.text)