在很多数据分析中,我们经常会看到数据与地图结合,形成热力图的可视化,可以让大家一目了然看到数据的地区分布的热度。
举个例子:腾讯,阿里巴巴,百度,爱奇艺,中国移动,中国农业银行......
这些你耳熟能详的大企业,都有着一个共同的身份:上市公司。改革开放之后,中国的资本市场慢慢起步,发展至今也不过短短二十多年的时间。
如今的资本市场规模宏大,已有了数千家企业成为了上市公司。而在普罗大众的眼里,上市公司更是市场竞争力强,公信度高等好企业的代名词。
不仅如此,在经济学家的眼里,上市公司的数量也是衡量一个地区经济发展的重要尺度。
而能够最直观地显示出这种地域分布数量与密度的,无疑就首推热力图(Heat Map)了。
热力图(Heat Map),也可称为热图,热量表(Heat Table),密度表(Density Map)。他主要是通过颜色变化程度,来直观地显示热点分布,区域聚集等数据信息的。作为密度图的一种,热力图中的高亮色往往表示发生频率高或者分布密度大,暗色则与之相反。
今天我们就来看看如何用Python制作这种直观明了的热力图。
01、导入第三方数据库
首先,将我们过程中会使用到的第三库进行导入,这里我们主要会用到pyecharts库,以及在数据处理中必不可少的pandas库。
02、数据准备
这里,我们使用“各省上市公司数.xlsx”的数据,利用pandas库的read_excel()进行数据读取,并查看前5行数据。
通过这份数据,利用groupby求出各省市上市公司数量。
03、定义可视化函数
通过函数定义,设置图形地图热力图细节,包括颜色、标题、标识等,可以根据自己的需求和审美进行调整。
04、绘制分布图
这样就得到了各省上市公司数量分布图。
通过地图热力图,我们一眼就可以看到颜色最深的广东,拥有最多的上市公司,江浙沪包邮区也有着不错的表现
网友评论