我们前面已经学习过了python的一些基础知识,这一节我们就来正式学习python爬虫,在学习python爬虫之前,我们要先学会如何导入三方类库。python的强大之处,就是有各种个样的三方类库来帮助我们快速的实现功能。
本节知识点
1,pycharm导入三方类库
2,requests类库的导入
3,简单爬取网站源码
一,pycharm开发者工具导入三方类库
我们用pycharm来导入三方类库很方便,
操作步骤就是,打开 File --> Settings --> Project Interpreter --> 点击右边 + 号 --> 搜索栏输入 requests --> 点击 Install Package 按钮
具体操作如下图所示。
1,点击下图所示的扳手
如果你是window电脑,找不到扳手,就点击file下面的settings
2,找到Project Interpreter 然后 点击下边 + 号
3,搜索栏输入 requests --> 点击 Install Package 按钮
4,安装成功,点击apply或者ok。
二,使用三方类库
上面第一步导入三方类库成功后,我们就可以愉快的使用了
三,爬取网站源码
运行代码,如下图所示
来看下运行效果
可以看到我们成功的爬取到了网站源码,我们后面要做的,就是从这些源码里拿到我们所需要的数据,比如拿到源码里的图片。
往期文章
- python入门001~python开发工具 pycharm的安装与破解(mac和window都有讲)
https://www.jianshu.com/p/dc8299467718 - python入门002~创建属于自己的第一个python项目
https://www.jianshu.com/p/eda772bde32a - python入门003~python3的安装~以python3最新版为例(Mac window都有讲)
https://www.jianshu.com/p/4bb23e40a7ac - python入门004~创建属于自己的第一个python3项目~python3基础知识的讲解
https://www.jianshu.com/p/0fadc0369abd - python入门005~基本数据类型和变量的学习
https://www.jianshu.com/p/44c2a7b34cbf - python入门009~python3操作数据库 借助pycharm快速连接并操作mysql数据库
https://www.jianshu.com/p/a23f414cc2f2 - python入门011~python3借助requests类库3行代码爬取网页数据
https://www.jianshu.com/p/cf22a679e96f - python入门012~使用python3爬取网络图片并保存到本地
https://www.jianshu.com/p/651effd4f3b8 - python入门013~爬虫篇,网页爬虫,图片爬虫,文章爬虫,Python爬虫爬取新闻网站新闻
https://www.jianshu.com/p/7e59f52ea0b6 - python入门014~把爬取到的数据存到数据库,带数据库去重功能
https://www.jianshu.com/p/5ba719a7d8cb - python入门015---python爬取前程无忧51job的职位信息并存入mysql数据库(带数据去重)
https://www.jianshu.com/p/fe434693781f
视频教程
点击这个地址可以试看:https://www.bilibili.com/video/av55521385/
如果觉得视频教程不错,可以加老师微信购买 ,老师微信 2501902696
网友评论