从本节开始,我们开始写代码模块的教程了。
1.为什么爬虫要用Python
Python写代码速度快。Python自诞生以来,秉承的思想就是简单优于复杂。所以Python写代码效率很高,在众多Python强大的库的加持下,我们可以用短短几十行代码写出来一个完整的Python爬虫程序。这在其他的语言里,是很难做到的。
Python学习成本低。Python的语法没有其他语言那么复杂,又因为是动态类型的语言,学习成本降低了很多,能够更快地上手,更方便的学习。
Python的多平台运行也能成为一个加分项。一份代码,能够在linux、MacOS、Windows都能够运行,并不需要对系统进行适配。
Python是一门功能强大的语言。用Python可以做到很多事情,现在人工智能大火,用得最多的语言是Python;用Python也可以写网站后台,而且有特别优秀的框架(Django、Flask、webpy...);用Python也能做桌面端GUI程序(PyQt、Python自带的tkinter);Python最强大的还是作为一个胶水语言的特性,我们可以用C语言写好一个功能,然后打包成Python的包,这样Python就能把一些对运算速度要求高的步骤,交给C语言这样的高性能语言去解决。
2. Python2.7 还是 Python3.x
毫无疑问,选择3.x。Python2.7作为一个历史遗留,将会在2020年失去Python团队的维护,所以如果不是强制要求用Python2.7,那就来Python3.x的怀抱吧。这里没有复杂烧脑的编码问题,对Unicode支持良好。
3. 下载Python安装包
1.首先进入Python官网的下载页面https://www.python.org/downloads/
2.进入下载页面之后,找到下面的Python列表。选择Python3.6的最新版3.6.5的,然后点击Download进入详情页面。
下载选择3.在下载文件选择页面选择适合你系统类型的Python安装包。
Python文件
选择第一步,看表格第二列,找到符合你的系统的那几行,比如我的是Windows,那就是找到Windows的那几行。
第二步,根据你的系统位数选择x86-64版本还是x86版本。x86-64就是我们说的64位的操作系统,x86就是32位操作系统。如何判断系统位数(桌面找到此电脑,右键选择属性)
查看电脑属性
然后在弹出来的电脑详情页面,有个系统类型。
操作系统位数
如果实在不会,那就选择32位的就好,因为64位系统也兼容32位的Python。
现在知道了我们选择哪个系统哪个类型的安装包了,可是x64和x86都有3个可以下载的包,应该选哪个呢?
第三步,选择安装包。
Windows x86-64 embeddable zip file 是嵌入式压缩包,缺少了一些Python的组件。不建议使用。
Windows x86-64 executable installer 是可执行的安装包,带有所有组件,我们只需要在安装过程中对一些必要的设置勾选就好。推荐使用。
Windows x86-64 web-based installer 是基于网络的安装包,它会在你启动之后,选择了版本,从网上下载具体的Python文件。但是有一个缺点,它会强制把你的安装目录安装到非常深层次的C盘里面去,会给以后寻找Python路径带来麻烦,不建议使用。
所以我们就选择 Windows x86-64 executable installer 点击下载了。
4. 安装Python
点开安装包,我们开始安装Python。
a.
自定义安装
首先勾选 Add Python 3.6 to PATH(这样节约了添加 Python.exe 目录到环境变量的步骤)
然后点击Customize installtion。(不选 install Now 是因为 Python 路径太深,不方便我们去找到)
b.
安装Python保持默认全勾选。Next
c.
最后一步设置勾选添加Python到环境变量。然后选择你要安装Python的文件夹。在你想要安装的盘新建一个文件夹,比如Python36,然后在界面选中文件夹。也可以选中了某个文件夹,然后在后面添加\Python36,这样会自动给你创建python36文件夹,并把Python3.6安装进去。
点击Install,坐等安装完成。
5.测试安装是否成功
按住Windows键+X键,会弹出一个框体程序
选择命令提示符点击命令提示符,打开后,输入 python -V
注意是大写的V,然后回车。
我们的显示结果不一样是因为我同时安装了Python2.7和3.5。你看到的输出应该是Python 3.6.5
。如果遇到了错误,就先继续下一步。
我们在命令行,再次输入pip3 -V
(pip -V
也可以,pip3是专指Python3.x版本的pip),V也是大写的,并回车正常情况下输出和下面差不多,只是Python版本或者PIP版本不一样。
如果都正常,那么恭喜你,安装Python成功了,并且pip的环境变量也配置好了!
6.解决遇到的问题。
在上一步如果显示'python' 不是内部或外部命令,也不是可运行的程序或批处理文件。
,那就是我们需要手动给Python设置环境变量。
'pip3' 不是内部或外部命令,也不是可运行的程序或批处理文件。
,那就是我们需要手动给pip设置环境变量。
设置环境变量的步骤:右键此电脑 —> 属性—>左边的高级系统设置—>环境变量
选中系统变量里面的 Path ,点击编辑。
找到我们安装Python的目录,比如我安装到了C盘的Python35文件夹中。
a. 添加Python到环境变量
提示Python不是内部或者外部命令
的才需要这一步。我们找到了安装Python的 文件夹,里面如果有一个 python.exe。那就找对了文件夹了。
我们点击上面的
路径选择
,就变成了上个图我们所看到的的情况了。然后我们复制这个路径。
回到刚才的环境变量里面,点击新增,然后把刚刚复制的路径粘贴进去。
添加Python环境变量
点击一下空白处,就保存了。再重新Windows键+X键打开命令行,Python -V
命令就能正常输出了。
b.添加pip到环境变量。
我们找到Python安装目录下的Scripts文件夹并进入,同样也点击顶部的路径并复制,到环境变量界面,再次点击新建,然后粘贴,点击空白处。再重新用重新Windows键+X键打开命令行,pip3 -V
就能输出了。
如果按照以上步骤做了,还是提示不是内部或外部命令的。请注意你是否关闭了命令行,并在添加了环境变量之后重启再打开的命令行。在新增环境变量之前的打开的命令行,是不会起效果的。
大功告成!
传送门:
下一章:
爬虫入门教程⑥—安装爬虫常用工具包
所有的章节:
网友评论