原文再续,书接上回
上一回是博主的处女作,大概讲了一下怎么用高德地图的API爬取POI数据。运行结果基本上就下边这样的:
上一篇的运行结果发出去以后,有同学给我吐槽,说这个运行结果用着有点麻烦,想存成文件后边好用。想想也对,今天就给大家写一下怎么把解析好的数据存成文件,后边好用。
要存文件,首先呢,要创建一个文件。今天呢,我们就用最简单最常用的txt文件来写吧(主要是作者习惯了用txt)。创建一个txt文件也很简单,一句代码搞定
poifile=open("POI.txt","wb")
open函数的各个参数的具体含义,大家有兴趣可以自行百度,我在这就不多说了。
好了文件创建好了,下边就该把数据写到文件里边了,还是一句代码
poifile.write(poi["name"] +","+ poi["type"] +","+ poi["location"] +"\n")
写到这里是不是大家觉得可以了,就两句代码嘛,还值得写一篇。哈哈哈,你么啊,还是Too Young Too Naive。借用一位不可提及名字的人的话“有必要告诉你们一些人生的经验了!!!”。
直接写这两句话上去的话,运行结果是这样的
啦啦啦啦报错了报错了到这步,其实你已经掉进py的坑里了。中文编码啊,当时我刚开始撸py的时候,中文编码也是把我虐的死去活来的。这又是一段心酸历史,有机会再说。
不过呢,写py有一个原则,遇到问题就找包,管他好包坏包,能解决问题就是好包。通过万能某度,我又找到了一个神包codecs。好了,把创建文件的代码改一下
poifile=codecs.open("POI.txt","wb","utf-8")
好了,运行走起。
结果到这,你已经可以调用高德的API爬一定区域内你想要的POI数据了,数据到手后再怎么分析,我就不太懂了,结合业务具体搞吧。文末,引用一下老吴的话
在高德API上进行。这不算一种正统的爬虫,因为爬虫的技巧和乐趣在于和被爬的网站进行博弈,要么你被封号封IP,要么你获得网页上有用的信息。而高德API及其类似的API,就像你要强奸她时,她反而大大方方把衣服解开,说您看,这是胸,这是腰,还有这是臀,您想模哪请自便。情趣立减三分!
所以想提高爬虫技能,API不算是一个好老师,我个人的理解。
好了,写文件的坑填完了,下次有时间继续填异常处理的坑。
老规矩:有需要这部分代码的同志可以给我发邮件,大概介绍一下自己,然后说明要这部分代码就好了,当然了,开发者的KEY我可是不会给的,自己去申请吧。邮箱1373415867@qq.com
网友评论