美文网首页@IT·互联网大数据玩转大数据
爬取链家数据,用气泡图分析武汉市二手房价格

爬取链家数据,用气泡图分析武汉市二手房价格

作者: 华天清 | 来源:发表于2018-05-31 10:02 被阅读9次

    本文是Excel气泡图应用的实践案例,通过气泡图对房地产数据分析的应用,让大家了解气泡图的适用场景,以及发现一些数据的特征。

    收集链家二手房数据

    利用gooseeker的在线快捷爬数据应用——数据DIY,抓取链家上武汉的二手房列表数据,一共爬到300条数据,把它作为样本,简单分析一下房产价格的影响因素。

    数据DIY地址

    数据处理

    对房屋信息一列用Excel的分列功能,清洗出户型、面积、朝向、装修、电梯情况这4类信息。

    对位置信息这列用分列功能,把建筑年代单独作为一列,再用mid函数提取出年代数值,最后用减法算出楼龄。

    最后要把文本格式的数据转为数值格式,后面画图需要用到。

    关于气泡图

    Excel的图表中大部分都只能展示两组变量之间的关系,即(x,y)数据点的分布,而气泡图则可以呈现三组变量之间的相互关系,即除了横坐标和纵坐标上的两个变量外,还可以通过气泡的大小变化来表达第三个变量的变化情况。在《爬取链家数据,用散点图分析武汉市二手房价格》一文中已经介绍了散点图的作用及制作方法,其实可以把气泡图归纳为散点图中的一种,只是气泡图比散点图多展示了一组数据间的关系,所以制作气泡图需要在散点图的基础上多准备一组数据用来表示气泡的大小。气泡图的每个气泡都包含三个值:x,y,z,其中 x 和 y 用于定位,z 表示计算气泡的大小。 下面来介绍一下气泡图的制作方法,大致与散点图制作方法一致。

    用Excel制作气泡图

    制作气泡图需要三个数据项,X轴数据,Y轴数据,代表气泡大小的数据。根据上面整理出来的房地产数据,用X轴表示面积,Y轴表示楼龄,用价格来表示气泡大小,借此来观察三者关系。

    数据准备好后我们开始制作气泡图,在Excel2016版本的插入图表中,气泡图已经放到了散点图的类别里,我们只需选中准备好的数据,分别点击:插入-查看所有图表-XY散点图-三维气泡图进行插入即可。

    生成的三维气泡图效果如下

    由于数据量比较多,所以生成的气泡都密密麻麻的挤在一起了,可以通过调节气泡的大小来让气泡散开。右键绘图区的气泡,选择设置数据系列格式,在右边弹出的设置栏中来调节气泡的大小

    调整到能大致观察到每个气泡点的大小,这里选择用气泡宽度表示气泡大小,缩放气泡大小调整为90

    调整之后的效果如下

    数据分析

    从图上气泡的分布情况来看,可以很明显的观察到,面积、楼龄和价格的关联性:

    在楼龄为2-17年区间,相等楼龄下,可以明显的发现气泡的大小随着面积的增大而增大,这说明同等楼龄下,面积越大的房源,价格越高。

    在面积为100-250区间,相等面积下,可以明显发现气泡的大小随着楼龄的增大而减小,这说明同等面积下,楼龄越大的房源,价格越低。

    相关文章

      网友评论

        本文标题:爬取链家数据,用气泡图分析武汉市二手房价格

        本文链接:https://www.haomeiwen.com/subject/vqofsftx.html