美文网首页python爬虫
python爬虫基础教程:urllib库(一)

python爬虫基础教程:urllib库(一)

作者: 9ba4bd5525b9 | 来源:发表于2019-04-09 14:57 被阅读110次

    1.1.urlopen函数的用法

    1.2.urlretrieve函数

    将网页上的文件保存到本地

    1.3.参数编码和解码函数

     urlencode函数用于编码中文和特殊字符

    parse_qs函数用于将经过编码后的url参数进行解码。

    1.4.urlparse和urlsplit函数用法

    urlparse和urlsplit都是用来对url的各个组成部分进行分割的,唯一不同的是urlsplit没有"params"这个属性.

    1.5.Request爬去拉勾网职位信息

    Request类的参数

    爬去拉钩网职位信息

    拉勾网的职位信息是在Ajax.json里面

    代码:

    1.6.ProxyHandler代理

    代理原理:在请求目的网站之前,先请求代理服务器,然后让代理服务器去请求目的网站,获取到数据后,再返回给我们。

    相关文章

      网友评论

        本文标题:python爬虫基础教程:urllib库(一)

        本文链接:https://www.haomeiwen.com/subject/ydibiqtx.html