准备开始学习数据采集和分析,先从爬虫爬取数据开始,决定采用python。把学习心得和笔记发出来跟大家分享。本系列我会分享在公众号和简书,名字都是【闲聊IT圈】。
首先我们搭建我们的开发环境。圈哥以WIN10为开发环境,对于Linux用户来说,我想自己应该可以搞定的,所以,这里就不赘述Linux的搭建细节了,步骤跟WIN基本是一致的。
一、安装Python
圈哥直接到官网下载的最新版本3.7,下载地址:https://www.python.org/downloads/windows/。很多Linux系统是自带python的,所以你用的是Linux的话,或许可以直接跳过这一步了。Windows用户建议安装到C盘。
这里要强调一下,python3和python2是不兼容的,也就是说,你用pthon2编写的程序可能无法在python3下运行。目前很多库(“库”在下面会说到)也不能同时支持python2和python3两个版本。这里建议选择python3,因为虽然python2的生态目前来说好那么一点点,但是python3已经成为不可阻挡的趋势,将来必然是python3的天下。
开始菜单安装完,在开始菜单里就能看到了,我们最近主要用到的是那个叫IDLE的,这个是python自带的编辑器,虽然比较简陋,但是对于我们目前的学习是足够的了。打开IDLE是下面这个样子。
二、安装库
python之所以很强大,很重要一个原因就是他拥有十分丰富的库。所谓库,就是其他人写好的功能模块,我们可以直接调用这些库来实现功能,而不必每项工作都自己去写一套代码。我们先安装一个我们马上就要用到的库,叫做requests(注意不要少了最后的s),这是一个用来进行网络请求的库。
具体安装方法很简单,打开你的命令提示符(如果是在C盘需要以管理员身份运行,Linux用户也要考虑权限问题),输入pip install requests。这条命令对于Linux用户来说应该很容易理解,这里主要跟Windows用户说一下,pip是一个程序的名字,他是python自带的库管理工具,默认随python一起安装,Linux用户的话可能需要单独安装。install是pip这个程序可以接受的一个参数,意思是告诉pip,我们要安装一个库,安装哪个库呢?就是下面接的那个requests,如果你要安装其他的库,直接把requests换成其他库的名字就可以了。输入完成按下回车,等一会requests库就安装好了。
安装requests库这里在说一下pip的工作原理,因为Windows用户可能对这种安装方式不是很熟悉。python在网上放了很多的库,当我们告诉pip要安装的库后,pip会到这个地方去查找,如果找到了就下载下来进行安装,好像我们手机到应用商店安装APP一样。
安装完,我们的环境基本就搭建好了,下面就可以进行代码的编写了。
更多系列课程,请关注微信公众号【闲聊IT圈】。
网友评论