•在RStudio中,使用rvest包爬取链家网上南京市二手房在售房源数据,经过数据的清洗,最终留下2980条二手房数据。
•数据包含二手房的各种信息,包括房子的名称、户型、面积、朝向、装修程度、电梯、楼层、总楼层、建造年份、建筑类型、地址、关注人数、带看次数、发布时间、总价、单价与经纬度。
•将数据保存为excel表格,用商业智能软件tableau打开表格绘制图表,对二手房数据做分析研究。
上图表示二手房总价分布,从图中可以看出来超过三分之一(约35%)的房子总价在200万到300万之间,27%的房子总价在100万到200万之间,17%的二手房总价在300万到400万之间。
上图表示二手房单价分布,一半的二手房单价在15000~30000元/平米之间,35%的二手房单价在30000~45000元/平米之间。
一平米一万五以下的房子,在南京二手房市场上已经很难找到了。
将不同位置的二手房平均单价做降序排列,上图是前十五名(宁海路、华侨路、北京东路、定淮门大街、凤凰西路、珠江路、奥体、玄武门等)。
宁海路的二手房单价最高,平均一平米八万二,然后是华侨路,一平米七万。总的来说,南京市单价较高的二手房集中分布在鼓楼区玄武区。
上图表示二手房平均单价后十五名,其中有禄口、泰山街道、将军大道、桥北等地方,二手房平均单价较低的大多分布在江宁和浦口。
从二手房面积分布上来看,接近50%的房子面积处于60~100平米这个区间。
约65%的二手房,其面积是小于100平方米的。
从户型来看,目前南京市二手房的户型以两室一厅、三室两厅、两室两厅为主流。
近三千的二手房中,除去一些房子无数据,剩下的差不多一半有电梯,一半没有电梯。
从装修程度来看,五分之一的房子是简装,不到三分之一的房子是精装,还有约5%的房子是毛坯房,约44%的房子没有给出装修程度的信息。
用2018减去房子的建造年份,计算出来二手房的房龄。
大约44%的二手房,房龄在十年以上、二十年以下,房龄在十年以下的二手房大约占34%,还有五分之一的二手房,房龄超过了二十年。
接下来分析一下哪些房子关注人数与带看次数最多,也就是最受关注的二手房。
将关注人数>=20与带看次数>=20作为筛选条件,将同时满足条件的二手房筛选出来,一共92条数据。
将关注度高的92条数据作为一个数据集,剩下的数据作为另一个数据集。
上图中的两个箱型图,右边的表示关注度高的二手房的单价分布,左边表示的是关注度没那么高的二手房的单价分布,可以看出更受大家关注的二手房其平均单价更低。
上图表示的是两个数据集的面积分布,右边是关注度更高的二手房的面积分布,可以看出更受关注的二手房其面积分布更加集中,平均面积也更小。
以上就是对南京市二手房市场简单的探索分析,主要关注了南京市在售二手房价格的区域分布情况,并了解了二手房户型、面积、房龄等基本情况。最后分析了一下关注人数与带看次数较高的二手房价格与面积的分布情况。
网友评论