2018-12-29
- 安装scrapy
1.1 使用pycharm新建虚拟环境(python_scrapy)
1.2 安装scrapy之前,先下载安装twisted(注意对应自己的python、操作系统版本!!),不安装twisted,直接安装scrapy会报错
下载twisted包
# 使用pip install (下载的twisted文件位置)安装twisted
data:image/s3,"s3://crabby-images/057ef/057efec3901541c9d88c7540f3e798a84279a085" alt=""
1.3 安装scrapy
pip install scrapy
data:image/s3,"s3://crabby-images/610af/610afb320f74a4639f2ff276315e63e5cd7427b8" alt=""
data:image/s3,"s3://crabby-images/78030/780300f8cb6b5f2fe6d0d5d6ba9a473c36a91736" alt=""
- 在pycharm中使用scrapy框架
2.1 创建爬虫项目,这里使用crawl模板,可以生成更接近我们想要的此次爬虫项目的初始版本。
# 创建项目名称
scrapy startproject <项目名称>
# cd到项目目录下,生成爬虫文件
scrapy genspider 模板名称 爬取的网址 --template=要使用的模板
data:image/s3,"s3://crabby-images/7d748/7d74860f04f8dcd2c819ac81ab996d8917f8bb75" alt=""
设置settings文件,防止被但爬虫机制发现,导致封掉IP
data:image/s3,"s3://crabby-images/c1046/c1046c683b1ae166a7dc1575734ee3cdf30c81bc" alt=""
网友评论