美文网首页
使用scrapy框架进行多进程爬取多个网站

使用scrapy框架进行多进程爬取多个网站

作者: 阿清_bd8d | 来源:发表于2019-03-13 21:32 被阅读0次

    1.scrapy项目的创建(pip3 install scrapy)

    scrapy  startproject  xiangmu  

    cd xiangmu

    scrapy genspider run xiangmu.com

    2.对run.py文件进行修改

    修改前

    修改后

    3.对settings进行修改

    添加一项:LOG_LEVEL = "WARNING"

    4.最后在run.py里面添加自己想抓取的网页,运行run(python3 run.py)文件即可。

    相关文章

      网友评论

          本文标题:使用scrapy框架进行多进程爬取多个网站

          本文链接:https://www.haomeiwen.com/subject/ytrxmqtx.html