Python爬虫学习（一）

作者: rrrwx | 来源:发表于2019-06-12 12:33 被阅读0次

Python爬虫学习（十六）初窥Scrapy
资料
Python爬虫学习系列教程
Python爬虫学习之小结（一）
爬虫入门
python爬虫学习-day7-实战
Python 基础爬虫目录
python爬虫学习-day5-selenium
python爬虫学习-day6-ip池
python爬虫学习-day3-BeautifulSoup

http://www.icourse163.org/course/BIT-1001870001?tid=1001962001#/info 授课老师：嵩天课程简介：“The website is the API.”网络爬虫逐渐成为自动获取网络信息的主要形式。

Requests库的使用：


import requests

r = requests.get(url)

构造一个向服务器请求资源的Request对象（大写）
返回一个包含服务器资源的Response对象

（1）Response对象的属性

r.status_code(200表示连接成功)
r.text（url响应内容）
r.content（响应内容的二进制形式）
r.encoding（从头部预测的编码方式）
r.apparent_encoding（从内容分析的编码方式）
-------r.encoding = r.apparent_encoding

(2)通用框架


import requests

def getHTMLText(url):

    try:

        r = requests.get(url, timeout=30)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return "wrong connection..."

if __name__ == "__main__":

    this_url = "http://www.baidu.com"

    print(getHTMLText(this_url))

(3)Requests库的主要方法


requests.request()---------基础方法

requests.get(); requests.head(); requests.post(); requests.put(); requests.patch(); requests.delete()

网友评论

本文标题：Python爬虫学习（一）

本文链接：https://www.haomeiwen.com/subject/exnkfctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python爬虫学习（一）

相关文章

Python爬虫学习（十六）初窥Scrapy

资料

Python爬虫学习系列教程

Python爬虫学习之小结（一）

爬虫入门

python爬虫学习-day7-实战

Python 基础爬虫目录

python爬虫学习-day5-selenium

python爬虫学习-day6-ip池

python爬虫学习-day3-BeautifulSoup

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读