Scrapy 命令

作者: JairusTse | 来源:发表于2020-01-13 15:16 被阅读0次

以无参方式输入scrapy命令会输出可用的命令:

xieyuedembp:Web100 xieyue$ scrapy
Scrapy 1.8.0 - no active project

Usage:
  scrapy <command> [options] [args]

Available commands:
  bench         Run quick benchmark test
  fetch         Fetch a URL using the Scrapy downloader
  genspider     Generate new spider using pre-defined templates
  runspider     Run a self-contained spider (without creating a project)
  settings      Get settings values
  shell         Interactive scraping console
  startproject  Create new project
  version       Print Scrapy version
  view          Open URL in browser, as seen by Scrapy

  [ more ]      More commands available when run from project directory

Use "scrapy <command> -h" to see more info about a command

全局命令:

startproject

【创建新项目】

$ scrapy startproject myproject
settings

【获取Scrapy的设置】

$ scrapy settings 
$ scrapy settings --get DOWNLOAD_DELAY
runspider

【在未创建项目的情况下,运行一个编写在Python文件中的spider】

$ scrapy runspider myspider.py
shell

【以给定的URL(如果给出)或者空(没有给出URL)启动Scrapy shell】

$ scrapy shell http://www.baidu.com
fetch

【使用Scrapy下载器(downloader)下载给定的URL,并将获取到的内容送到标准输出】

$ scrapy fetch --nolog http://www.baidu.com
$ scrapy fetch --nolog --headers http://www.baidu.com
view

【在浏览器中打开给定的URL,并以Scrapy spider获取到的形式展现】

$ scrapy view http://www.baidu.com
version

【输出Scrapy版本】

$ scrapy shell http://www.baidu.com

项目(Project-only)命令:

crawl

【使用spider进行爬取】

$ scrapy crawl myspider
check

【运行contract检查】

$ scrapy check -l
$ scrapy check
list

【列出当前项目中可用的spider】

$ scrapy list
edit

【使用editor中设定的编辑器编辑给定的spider】

$ scrapy edit spider1
parse

【获取给定的URL并使用相应的spider分析处理】

$ scrapy parse http://www.example.com/ -c parse_item
genspider

【在当前项目中创建spider】

$ scrapy genspider videos_spider douban.videos.com
bench

【运行benchmark测试】

$ scrapy bench

相关文章

网友评论

    本文标题:Scrapy 命令

    本文链接:https://www.haomeiwen.com/subject/ywtmactx.html