笔者认为,上海链家网的数据与其它房地产中介公司网站相比,甚至与房产交易中心的数据相比,都还是算是比较准确的。由于链家网所谓的隐私保护策略,至多只能查询到截止两周前的成交数据,所以本文挑选了最近一个完整的整月2016年8月,来分析作为上海各个区县的二手房成交均价和核心区域的二手房签约套数。
使用的工具:
1) python 编写的网络爬虫程序
2) tableau desktop v10.0
3) mysql 数据库
4) 百度API接口,经纬度查询功能
下图是上海整体的2016年8月二手房各区县成交均价。其中由于核心区域的位置比较接近,图片没有很好的给区分。
接下来,那我们来看看核心区域的成交情况吧,圆点下面,上面的数字显示为链家8月签约套数,下面的数据为成交均价。
以上即是从网络数据获取、数据清洗入库、数据分析这一条完整应用链的一次尝试。后续还将继续通过网络爬虫+可视化工具的方式,陆续推出更多的有价值的可视化分析结果。
此图的交互式版本可以点击"阅读原文”通过手机浏览器即可访问。至于明细的全部成交数据 (大概6万多条,每天还在定时更新,包括的维度和度量有:单价(元)、户型、 ID、 URL、 楼层 、总面积 、片区、 区县 、签约日期 、小区 、挂牌总价等等),可以关注微信公众号“鲜活的数据”留言获取,或者登录数多多网站http://www.dataduoduo.com/搜索“链家“关键字即可下载。
网友评论