我的PySpider前一天安装后做了一个小项目,完全OK,当天打开重新执行时,就死那儿了,查看提示信息说是result_worker starting...
问题解决:
pip install -U setuptools
重新打开
pyspider all
OK了。
先简单介绍下pyspider,安装过pyspider后,windows在cmd.exe中输入pyspider all调用pyspider所有组件,打开浏览器,输入localhost:5000或者127.0.0.1:5000可以看到这样一个界面:
![](https://img.haomeiwen.com/i3410455/3c3ac2d47f5e65cd.png)
可以忽略我做过的一些小练习(#^.^#),在右侧有一个create,点一下会跳出一个窗口。
![](https://img.haomeiwen.com/i3410455/2503eaa2da9f5654.png)
在project name中输入项目名称,在starturl里输入要爬取的初始网页,这里也可以空着不填,然后点create就可以了。后面的事情自己玩一下OK了,不细说了。说下前台页面就是第一张图。
group代表分组,status中有stop,todo,running,Checking和debug五种模式,选择running或者debug模式时可以运行项目。progress和rate不用考虑太多,avg time是平均运行时长,actions中,有三个按键,分别代表运行,当前任务,和运行结果,当执行完创建的项目后,可以点开看一下。
Active Tasks的页面是这样的:
![](https://img.haomeiwen.com/i3410455/e6d0ae3dcdc70ec9.png)
Results的页面是这样的,就是爬取后的结果详情:
![](https://img.haomeiwen.com/i3410455/010c24640ba8c923.png)
重新执行,一般一个项目如果在前台执行后,再次点run,几乎不再会有结果输出了,那么如何重新运行呢?只有选择简单粗暴的方式了--重新建一个项目,将原来的代码复制过去,重新执行,其他方法也可以,但没这个方便。所以在调试时要确保调试时输出的结果时自己想要的再去前台执行,否则还是在调试状态修修补补。
删除项目,将status改成stop,把分组改成delete,一段时间后就自动删除了。
progress中的时间,运行一个项目后,将鼠标移上去就可以看到一些状态信息,5分钟内、一小时内、一天内、所有的状态,新的请求,完成的请求,正在执行的请求,失败的请求。
![](https://img.haomeiwen.com/i3410455/fc6975af59e45cfd.png)
网友评论