美文网首页
使用scrapy框架进行多进程爬取多个网站

使用scrapy框架进行多进程爬取多个网站

作者: 阿清_bd8d | 来源:发表于2019-03-13 21:32 被阅读0次

1.scrapy项目的创建(pip3 install scrapy)

scrapy  startproject  xiangmu  

cd xiangmu

scrapy genspider run xiangmu.com

2.对run.py文件进行修改

修改前

修改后

3.对settings进行修改

添加一项:LOG_LEVEL = "WARNING"

4.最后在run.py里面添加自己想抓取的网页,运行run(python3 run.py)文件即可。

相关文章

网友评论

      本文标题:使用scrapy框架进行多进程爬取多个网站

      本文链接:https://www.haomeiwen.com/subject/ytrxmqtx.html