Python3简单爬虫

作者: jadegg | 来源:发表于2017-06-08 19:15 被阅读0次

python制作一个简单的书单爬虫
Python3简单爬虫
Python3爬取ACM近期比赛数据并写入Excel文档
python3 爬虫学习python爬虫库-requests使用
崔庆才Python 3开发网络爬虫，教程+书籍
Python 爬虫
Python3 网络爬虫与开发实战
你对python爬虫略知一二？来看这篇文章我让你快速入门！
Python3 简单爬虫框架
用Python爬取猫眼电影排行榜TOP100

先从一个最简单的页面开始爬起

    from urllib import request
    res = request.Request("http://www.baidu.com")  #构建请求
    res = request.urlopen(res) #获取服务器响应
    print(res.read().decode('utf-8')) #读取设置编码  输出到控制台

运行

但是往往裸奔版对一些网站是爬不了的，这时就需要对爬虫进行一些伪装了。伪装浏览器或者加入延时。
改成如下代码

    from urllib import request
    import ssl

    res = request.Request("http://www.baidu.com")

    res.add_header("User-Agent","Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko)   Chrome/58.0.3029.81 Safari/537.36")
  context = ssl._create_unverified_context()
    res = request.urlopen(res,context=context)
    print(res.read().decode('utf-8'))

这样就成功完成伪装了

python制作一个简单的书单爬虫
python制作一个简单的豆瓣书单爬虫运行环境 python3 request库 BeautifulSoup r...
Python3简单爬虫
先从一个最简单的页面开始爬起运行但是往往裸奔版对一些网站是爬不了的，这时就需要对爬虫进行一些伪装了。伪装浏览器...
Python3爬取ACM近期比赛数据并写入Excel文档
这个爬虫是今年暑假时学完小甲鱼的Python视频后写的。关于Python3的爬虫教程不多，下面只是使用了一些简单的...
python3 爬虫学习python爬虫库-requests使用
python3 爬虫库requests介绍在python3的爬虫库中，requests是日常使用的非常多的第三方...
崔庆才Python 3开发网络爬虫，教程+书籍
本书《Python3网络爬虫开发实战》全面介绍了利用 Python3 开发网络爬虫的知识，书中首先详细介绍了各种类...
Python 爬虫
一、背景某个比赛要从网上抓取图像，于是做了简单爬虫入门。二、基础 1、首先是python3的urllib，获取...
Python3 网络爬虫与开发实战
下载地址：python3 网络爬虫与开发实战
你对python爬虫略知一二？来看这篇文章我让你快速入门！
Python3 爬虫快速入门攻略一、什么是网络爬虫？ 1、定义：网络爬虫（Web Spider），又被称为网页蜘...
Python3 简单爬虫框架
目录爬虫简介调度器 URL管理器下载器解析器输出器实例 Demo 简介爬虫是一段自动抓取互联网信息的...
用Python爬取猫眼电影排行榜TOP100
参考资料《Python3网络爬虫开发实践》，作者崔庆才这篇博客参考了崔庆才的《Python3网络爬虫开发实践》有...