所以说数据源并不一定得用爬虫去获取。我以前总认为想要获取数据就必须写个Python爬虫去抓,奈何自己水平不够.....
当然了,自己写爬虫来抓取的数据可定制化程度最高,所以说多学点爬虫也是很有必要的。
很多政府机关、高校以及企业都有开放数据源,比如本文的数据源来自于:[北京大学开放研究数据平台 ]: http://opendata.pku.edu.cn/
这是一份全国高等院校名单
先来看一下各个城市的高校数量分布图:
以上十三个城市都有50所以上的高校,其中北京、武汉和广州的高校最多,分别为92所,84所和83所。
生成一张气泡图,颜色越深的数量越多。有点像“球球大作战”
再看看教育部直属高校的分布情况
啧啧,北京共有25所教育部直属高校,遥遥领先其他城市,果然帝都的教育资源就是丰富。
最后再看看本科和专科的占比情况:
我朝目前有1100所本科,1200所专科,
Null为公办院校
这么多大学,好一点的其实就只有那几十所而已。
网友评论