先扯扯淡
很久没写文章了,恐怕大部分人都忘了我了,没办法,人脑虽然有各种缺陷,但是垃圾回收机制却是异常强大。
前段时间一直在忙swift文档的翻译,之后又是各种事,直接导致了公众账号死亡。不得不说,世界变化太快,本想着和我那一千个粉丝一起做安静的美男子,但是天不遂人愿,各种事情接踵而至,最后不得不忍痛放弃了公众号的更新。在此也对粉丝们说句后会无期,虽然你们可能看不到。
Python之父Guido为requests提出过一些有关发展路线的建议。
requests是一个Python的网络请求库,和urllib、httplib之流相比起来最大的优点就是好用,requests官方标榜的就是“我们的库是给人用的哦”。此外,requests还支持https验证并且是线程安全的。
由于工作原因需要使用requests,确实好用,就顺便把代码研究了一番,记录一些关键要点,希望对诸位有所帮助。
一点提醒
本文只会讲解requests的思路和结构,但是不会涉及到语法细节,我认为细节还是大家自己去研究最合适,我这人也懒,能少打几个字就少打几个字吧。
burst link!!
requests中有三巨头(顺便提个小问题,这里有人知道雷霆三巨头吗?没错我说的是萎勃那三个):session,request和cookie。
先说最简单的cookie。
cookie嘛,就是把Python自带的cookielib.CookieJar封装了一下,让它能适应范围更广的输入并且支持一些高端功能(比如检测是否有相同cookie),如果大家想读源码的话,cookie是一个不错的切入点。
接着说session和request。
首先跟我读一遍:session包含request。
session就是会话,一个session下可能有多个请求(因为可能有redirect),提出session的目的是在多个请求之间保存相同的信息。举个例子:如果没有session,那你每次发请求都需要自己构造cookie并传入,但是有了session之后,只要第一次请求传入cookie就可以,相同session中之后的请求都会自动加上这些cookie。
需要注意,发送请求是在session中实现的,也就是说你要“让session发送request”,request本身只是一个物体,它自己不会发送自己。
request有两种形态,第一形态是一个对象,就是我们在代码中常用的那种。但是这种形态是没办法直接发送的,大家都知道,网络请求到最后其实都是一些字符串,所以如果要发送request的话必须启用它的第二形态,这时候它就叫做prepared request,也就是说“我准备好了,我准备好了,我准备好了(海绵宝宝上线)”,此时request内部的一些东西比如header、body就已经转换成字符串,可以发送了。
需要注意,只有第二形态的request可以发送。
下面看代码。
resp = requests.get('http://www.baidu.com')
print resp.content
这是普通青年的用法,可以直观地感受到requests到底多亲切。
s = requests.Session()
s.headers.update({'laozizuidiao': 'laozizuidiao'})
s.get('http://www.gov.cn')
s.get('http://www.beijing.gov.cn')
这是作死青年的用法,前面我们说过,session会保存信息,所以现在我们每次发送请求的时候都会宣布我们是zuidiao的。
s = Session()
req = Request('GET', url,
data=data,
headers=header
)
prepped = req.prepare()
# 你这种情况……是要加钱的
resp = s.send(prepped,
stream=stream,
verify=verify,
proxies=proxies,
cert=cert,
timeout=timeout
)
print(resp.content)
最后是大家最期待的文艺青年的用法,我们先生成了session和request,然后让request进入第二形态(prepare),这时候万事俱备只差send了,我们可以对request做任何爱做的事,然后最后爽完了send就行了。
我就不信你能看到这
还真看到这了?那我就说说看源码的方法吧。
其实很简单,看源码看的是思想。谁都会写那些isinstanceof、if、init,关键要明白作者的设计思路到底是什么。
比如requests,看完了你应当问问自己,cookie为什么要封装而不是直接用?request为什么要有两个形态?设计session是为了解决什么问题?
只有理解了设计思路,再去看具体的细节实现才能有收获,否则你看到的就是满屏的raise、isinstanceof,这样去看代码恐怕是浪费时间了。
最后祝你,身体健康,谢谢。
网友评论
牛逼
欣赏你用诙谐的笔调写技术类干货的方式。
> Python之父Guido是requests的核心开发者之一。
众所周知 [requests](https://github.com/kennethreitz/requests) 是 [Kenneth Reitz](https://github.com/kennethreitz) 的作品。项目的[贡献者](https://github.com/kennethreitz/requests/graphs/contributors) 也没见有 Guido。
@游魂 赶紧发掘几个用户需求压压惊!
哎?似乎什么奇怪的东西混进来了。。。