1. 安装Twistedxxx.whl文件
- 网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
此处我采用了离线安装,下载下来文件以后直接文件位置进入黑窗口输入dos命令,pip install 文件名 - 理由:直接 pip install scrapy 一般都是不能安装好的,一般会缺失Twisted 需要依赖VC++14.0 所以要离线安装Twistedxxx.whl文件
2. 安装 scrapy
- 命令:pip install scrapy
3. 检测是否已经安装好
- 检测方法:进入黑窗口输入dos命令,scrapy bench
- 检测不成功一般是提示安装pywin32(win32api),输入dos命令安装,pip install pywin32
- 再次检测是否已经安装好,如果没有安装好就再安装一次scrapy,pip install scrapy
4. 【scrapy简介】
- Scrapy异步网络框架 Twisted 多线程
- 为了采集网页 将非结构化的数据-->结构化的数据
- 各种中间件接口
(1) IP代理替换
(2) User-Agent
(3) Cookie
(4) 并发
(5) 支持自定义指纹
(6) 支持数据的保存MySQL Redis....
- 各种中间件接口
- Scrapy支持监控爬虫 发邮件提醒采集进度 采集错误....
网友评论