欢迎大家关注公众号【哈希大数据】
前面已经分享过用Requests库、Selenium库结合正则表达式、BeautifulSoup库爬取一些租房信息、招聘信息、淘宝商品信息,接下来准备给大家分享一个更为强大的爬虫框架——scrapy,接下来主要介绍scrapy的安装过程。
Windows环境
1.首先确保电脑上已安装Python
如果没有安装过Python,请参考教程:http://blog.csdn.net/qq_29883591/article/details/52664478(谢谢陌上行走的分享)
如果已安装Python,可按以下步骤检验Python可执行程序路径是否已加入到PATH环境变量中。
利用win+R快捷键打开运行窗口,输入cmd打开命令行,在命令行中输入python --version,如果出现Python版本信息如下图
则说明Python可执行程序已加入PATH环境变量中,如果没有出现则需要python.exe所在文件及scripts文件路径加入到PATH环境变量。例如将C:\Python2.7;C:\Python2.7\Scripts;加入到环境变量PATH,可打开命令行,并且运行以下命令来修改 PATH
:
<pre style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important;">c:\python27\python.exe c:\python27\tools\scripts\win_add2path.py</pre>
关闭并重新打开命令行窗口,使之生效。
2.安装pip
pip是用来安装其他必要包的工具,一般安装完Python,pip已经安装好了,咱们可以在命令行里输入:pip --version,检查是否安装完成,及安装版本。如果出现下图信息 image说明pip已安装,否则首先下载 get-pip.py,下载好之后,选中该文件所在路径,执行下面的命令:python get-pip.py,执行命令后便会安装好pip。
3.安装scrapy
上面两步铺垫工作已经做好啦,接下来上演重头戏,安装scrapy,在命令行输入:pip install scrapy ,接下来的安装过程会比较长,因为scrapy需要大量其他Python库。如果一切顺利,最终大家将看到下面的信息
image如果安装过程遇到什么问题欢迎在下面留言。
Linux环境
linux环境安装scrapy相对简单,因为其已经预装了Python环境,不过一般为Python2.7版本,如果想安装Python3,请参考:https://www.cnblogs.com/Guido-admirers/p/6259410.html(感谢橡皮头的分享)
然后直接在命令行中输入sudo pip install scrapy即可
小结
本次分享简单介绍Pythony重要的爬虫框架scrapy库Windows环境和Linux环境的安装过程,如果大家在安装过程中遇到什么问题欢迎在下面留言,下次分享将为大家介绍如何快速上手scrapy。
网友评论