导语
闲来无事,随手爬点数据顺便简单地可视化分析一波吧。利用Python爬取并简单分析A股公司数据。让我们愉块地开始吧~本文源代码加小编QQ群:700341555获取,还可获取更多Python资料!
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!开发工具
Python版本:3.6.4
相关模块:
requests模块;
bs4模块;
lxml模块;
pyecharts模块;
wordcloud模块;
jieba模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
数据爬取
目标网站:
需要爬取的数据如下图所示:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!懒得动脑子了,直接借助BeautifulSoup提取的这些数据,简单粗暴,源代码如下:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!完整源代码详见相关文件中的Spider.py文件。
运行效果截图如下:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!All done~
数据分析
在数据爬取部分,我们共获得了3573条A股公司数据,下面我们就来简单地可视化分析一波吧~
首先让我们来看看A股公司的区域分布吧:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!其中A股公司超过三百家的省份有:
- 广东
- 北京
- 浙江
- 江苏
接下来再来看看A股公司的收入情况吧:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!其中主营业业务收入TOP10为:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!再来看看A股公司的员工数量呗:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!再来看看A股公司的上市时间分布呗:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!其中,2013年上市的公司数量最少(2个);2017年上市的公司数量最多(438个)。
OK,要不我们再来看看A股公司所在的行业类型占比TOP10吧:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!Emmmm,很真实。
最后,我们把A股公司主营业务画成词云看看呗:
小伙利用Python爬取某公司A股数据,老板竟花重金寻他!All done!本部分内容涉及到的所有源代码均在相关文件中的analysis.py文件内。
网友评论