美文网首页
0. Urllib 概览

0. Urllib 概览

作者: 江湖十年 | 来源:发表于2018-06-14 11:26 被阅读7次
    1. urllib.request
      最基本的 HTTP 请求模块,我们可以用它来模拟发送一请求,就像在浏览器里输入网址然后敲击回车一样,只需要给库方法传入 URL 还有额外的参数,就可以模拟实现这个过程了。
    2. urllib.error
      异常处理模块,如果出现请求错误,我们可以捕获这些异常,然后进行重试或其他操作保证程序不会意外终止。
    3. urllib.parse
      一个工具模块,提供了许多 URL 处理方法,比如拆分、解析、合并等等的方法。
    4. urllib.robotparser
      主要是用来识别网站的 robots.txt 文件,然后判断哪些网站可以爬,哪些网站不可以爬的,其实用的比较少。

    相关文章

      网友评论

          本文标题:0. Urllib 概览

          本文链接:https://www.haomeiwen.com/subject/rqscrftx.html