按专业描绘美国学士学位女性占比变动丨数析学院
课程简介
用到的Python库
如果你的电脑上没有 Python,可以使用 Anaconda Python distribution 来安装大部分需要的包。Anaconda 提供了一个简单方便的双击安装程序,除了BeautifulSoup、pandas和matplotlib之外,该代码使用的是基本的Python库。在命令行中,你可以使用 pip 安装这些库,通过键入如下命令:
pip install beautifulsoup4 pandas matplotlib
如果你使用 Mac, Linux, 或者 Unix machine,你可能需要在命令之前键入 sudo,使用管理员权限安装包。
抓取 NCES 数据库
本节使用的数据抓取自 NCES database。NCES 数据库可以作为 Excel 文件下载,但是我们不想处理一堆 Excel 文件,所以直接使用 BeautifulSoup 来抓取 NCES 数据库网页。
运行下面的代码,将创建一个名为 gender_degree_data.tsv 的文件,其中包含有关美国性别细分、不同专业学位的所有数据。
注:该 notebook 由 Randal S. Olson 提供,具体请参阅 repository README file
1、获取 NCES 数据库数据



未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/168
更多课程和文章尽在微信号:「datartisan数据工匠」

网友评论