今天我们来做一个简单的python爬虫示例,让大家看看python爬取数据的方便之处。
先来看下我们实现的效果
本节知识点
1,python导入三方类库的学习
2,requests类库的简单使用
3,爬取网页数据
一,先把实现代码贴出来给大家
# -*- coding:UTF-8 -*-
import requests
if __name__ == '__main__':
target = 'http://gitbook.cn/'
req = requests.get(url=target)
print(req.text)
这就是本节的全部代码,是不是很简单,这就是python的魅力所在。用最少的代码做最多的事。
二,创建一个python类,把上面的代码复制进去。
如创建一个叫 pachong的类,如下图
创建好以后,把上面第一步的代码复制进去,这时候会报红。
要解决这个报红,我们就要学会导入三方类库。
三,导入类库
其实导入三方类库也很简单,有下面两种方式。
如上面两种方式,我们便可以轻松的导入类库了。
四,运行代码
运行完后,就可以爬取到网页数据了,如下图。
到这里我们就轻松的实现了网页数据的爬取,我们后面要做的就是使用正则表达式,从上图的数据中,过滤出自己需要的数据。
网友评论