requests源码浅析

作者: 梁杰_numbbbbb | 来源:发表于2014-08-26 20:31 被阅读4848次

    先扯扯淡

    很久没写文章了,恐怕大部分人都忘了我了,没办法,人脑虽然有各种缺陷,但是垃圾回收机制却是异常强大。

    前段时间一直在忙swift文档的翻译,之后又是各种事,直接导致了公众账号死亡。不得不说,世界变化太快,本想着和我那一千个粉丝一起做安静的美男子,但是天不遂人愿,各种事情接踵而至,最后不得不忍痛放弃了公众号的更新。在此也对粉丝们说句后会无期,虽然你们可能看不到。

    Python之父Guido为requests提出过一些有关发展路线的建议。

    requests是一个Python的网络请求库,和urllib、httplib之流相比起来最大的优点就是好用,requests官方标榜的就是“我们的库是给人用的哦”。此外,requests还支持https验证并且是线程安全的。

    由于工作原因需要使用requests,确实好用,就顺便把代码研究了一番,记录一些关键要点,希望对诸位有所帮助。

    一点提醒

    本文只会讲解requests的思路和结构,但是不会涉及到语法细节,我认为细节还是大家自己去研究最合适,我这人也懒,能少打几个字就少打几个字吧。

    burst link!!

    requests中有三巨头(顺便提个小问题,这里有人知道雷霆三巨头吗?没错我说的是萎勃那三个):session,request和cookie。

    先说最简单的cookie。

    cookie嘛,就是把Python自带的cookielib.CookieJar封装了一下,让它能适应范围更广的输入并且支持一些高端功能(比如检测是否有相同cookie),如果大家想读源码的话,cookie是一个不错的切入点。

    接着说session和request。

    首先跟我读一遍:session包含request。

    session就是会话,一个session下可能有多个请求(因为可能有redirect),提出session的目的是在多个请求之间保存相同的信息。举个例子:如果没有session,那你每次发请求都需要自己构造cookie并传入,但是有了session之后,只要第一次请求传入cookie就可以,相同session中之后的请求都会自动加上这些cookie。

    需要注意,发送请求是在session中实现的,也就是说你要“让session发送request”,request本身只是一个物体,它自己不会发送自己。

    request有两种形态,第一形态是一个对象,就是我们在代码中常用的那种。但是这种形态是没办法直接发送的,大家都知道,网络请求到最后其实都是一些字符串,所以如果要发送request的话必须启用它的第二形态,这时候它就叫做prepared request,也就是说“我准备好了,我准备好了,我准备好了(海绵宝宝上线)”,此时request内部的一些东西比如header、body就已经转换成字符串,可以发送了。

    需要注意,只有第二形态的request可以发送。

    下面看代码。

    resp = requests.get('http://www.baidu.com')
    print resp.content
    

    这是普通青年的用法,可以直观地感受到requests到底多亲切。

    s = requests.Session()
    s.headers.update({'laozizuidiao': 'laozizuidiao'})
    s.get('http://www.gov.cn')
    s.get('http://www.beijing.gov.cn')
    

    这是作死青年的用法,前面我们说过,session会保存信息,所以现在我们每次发送请求的时候都会宣布我们是zuidiao的。

    s = Session()
    req = Request('GET', url,
        data=data,
        headers=header
    )
    prepped = req.prepare()
    
    # 你这种情况……是要加钱的
    
    resp = s.send(prepped,
        stream=stream,
        verify=verify,
        proxies=proxies,
        cert=cert,
        timeout=timeout
    )
    
    print(resp.content)
    

    最后是大家最期待的文艺青年的用法,我们先生成了session和request,然后让request进入第二形态(prepare),这时候万事俱备只差send了,我们可以对request做任何爱做的事,然后最后爽完了send就行了。

    我就不信你能看到这

    还真看到这了?那我就说说看源码的方法吧。

    其实很简单,看源码看的是思想。谁都会写那些isinstanceof、if、init,关键要明白作者的设计思路到底是什么。

    比如requests,看完了你应当问问自己,cookie为什么要封装而不是直接用?request为什么要有两个形态?设计session是为了解决什么问题?

    只有理解了设计思路,再去看具体的细节实现才能有收获,否则你看到的就是满屏的raise、isinstanceof,这样去看代码恐怕是浪费时间了。

    最后祝你,身体健康,谢谢。

    相关文章

      网友评论

      本文标题:requests源码浅析

      本文链接:https://www.haomeiwen.com/subject/kthytttx.html