在你开始爬取网站之前,你得先建立一个Scrapy项目。在命令行中输入你要建立项目和存放代码的路径(cd C:/project/filepath),然后运行:
>Scrapy startproject tutorial
这将会建立一个tutorial项目,而文件树如下图:
-
tutoral/
-
scrapy.cfg #部署配置文件
-
tutorial/ #项目的Python模块,你将会从这导入的的代码模块
- __init__.py #初始化文件
- items.py #定义项目的文件
- pipelines.py #项目的管道文件
- setting.py #项目设置文件
-
spider/ #存放爬虫的文件夹
- __init__.py
-
网友评论