从今年开始学习Python,先后学习了《笨办法学Python》和侯爵老师的《编程小白的第一本 Python 入门书》,本应该算是入门了,但由于缺少练习,自己其实还是一头雾水。目前学习侯爵老师的【0基础Python实战:四周实现爬虫网站】,才终于算是入门了。毕竟编程的学习就是一个Learning by doing的过程,掌握了最少必要知识后,剩下的就是去实践了。我会陆续总结出Python爬虫学习过程中的笔记,供和我一样的小白共同学习。
今天先从准备工作开始
1、安装工作
①IDE安装
开始的准备工作当然是安装Python,然后选择安装一个IDE(Integrated Development Environment,集成开发环境)。安装Python的教程实在太多了,这里就直接略过了。放一个链接供大家参考:http://www.jianshu.com/p/c84a0ad86962。
简单介绍一下IDE,IDE是用于程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面工具,集成了代码编写功能、分析功能、编译功能、debug功能等一体化的开发软件套。目前我一共接触了两个IDE软件,一个是Pycharm,另一个是ATOM 。Pycharm是由捷克公司JetBrains开发的IDE,拥有Windows,macOS 和Linux版本,也是程序员们适用最多的一种IDE。Pycharm分为专业版和社区版,专业版是收费的,但对于普通大众来说,社区版已经足够我们适用。
Atom则是由GitHub开发的IDE,同样支持Windows,macOS 和Linux操作系统。与Pycharm不同的是,Atom是开源的,也是完全免费的,可以自己去安装各种插件来满足自己的口味。不过对于我这样的小白来说,还是推荐Pycharm,可以直接上手使用。之前在win10的环境下,使用Atom安装终端插件真是折腾了很久才成功,如果只是为了快速上手学习Python的话,个人还是推荐Pycharm。
②安装库
Python提供了丰富多彩的库,就好比武器库一样,根据不同的场景和作战方式,需要选择不同的武器。有了这些库,就能使你发挥更加强大的战斗力。使用库,就像站在了巨人的肩膀上,不用再重新写代码,而是直接调用库中的代码开始运行。目前需要用到的库有lxml、BeautifulSoup和requests,因为我用的win10,就只介绍win下的安装方法啦。
(1)pip安装
a.win+r键打开运行,输入cmd,打开cmd命令窗口
b.以安装lxml库为例,在窗口中输入“pip install lxml",如果安装成功,会提示“Successfully installed lxml"
(2)IDE中安装
a.打开Pycharm,在菜单中选择:File > Default Settings
b.在Default Settings窗口中,选择:Project Interpreter > 右侧下拉栏中选择所安装的Python程序 > 选择右侧“+”键进行安装。
c.进入Available Packages搜索所需要的库,点击左下角的“Install Package”安装即可。
至此,准备工作结束。但是还想再啰嗦两句,如果想更高效地学习Python,最好能科学上网,开始学习使用Google搜索,学习自己去解决一些最基本的问题,最后附上一个Google搜索的简单教程作为彩蛋。链接:http://pan.baidu.com/s/1kVFwPvx 密码:a2qp
网友评论