美文网首页
先来爬爬POI_续

先来爬爬POI_续

作者: Giser1993 | 来源:发表于2017-05-20 21:44 被阅读0次

    原文再续,书接上回

    上一回是博主的处女作,大概讲了一下怎么用高德地图的API爬取POI数据。运行结果基本上就下边这样的:

    上一篇的运行结果

    发出去以后,有同学给我吐槽,说这个运行结果用着有点麻烦,想存成文件后边好用。想想也对,今天就给大家写一下怎么把解析好的数据存成文件,后边好用。

    要存文件,首先呢,要创建一个文件。今天呢,我们就用最简单最常用的txt文件来写吧(主要是作者习惯了用txt)。创建一个txt文件也很简单,一句代码搞定

    poifile=open("POI.txt","wb")

    open函数的各个参数的具体含义,大家有兴趣可以自行百度,我在这就不多说了。

    好了文件创建好了,下边就该把数据写到文件里边了,还是一句代码

    poifile.write(poi["name"] +","+ poi["type"] +","+ poi["location"] +"\n")

    写到这里是不是大家觉得可以了,就两句代码嘛,还值得写一篇。哈哈哈,你么啊,还是Too Young Too Naive。借用一位不可提及名字的人的话“有必要告诉你们一些人生的经验了!!!”。

    直接写这两句话上去的话,运行结果是这样的

    啦啦啦啦报错了报错了

    到这步,其实你已经掉进py的坑里了。中文编码啊,当时我刚开始撸py的时候,中文编码也是把我虐的死去活来的。这又是一段心酸历史,有机会再说。

    不过呢,写py有一个原则,遇到问题就找包,管他好包坏包,能解决问题就是好包。通过万能某度,我又找到了一个神包codecs。好了,把创建文件的代码改一下

    poifile=codecs.open("POI.txt","wb","utf-8")

    好了,运行走起。

    结果

    到这,你已经可以调用高德的API爬一定区域内你想要的POI数据了,数据到手后再怎么分析,我就不太懂了,结合业务具体搞吧。文末,引用一下老吴的话

          在高德API上进行。这不算一种正统的爬虫,因为爬虫的技巧和乐趣在于和被爬的网站进行博弈,要么你被封号封IP,要么你获得网页上有用的信息。而高德API及其类似的API,就像你要强奸她时,她反而大大方方把衣服解开,说您看,这是胸,这是腰,还有这是臀,您想模哪请自便。情趣立减三分!

         所以想提高爬虫技能,API不算是一个好老师,我个人的理解。

    好了,写文件的坑填完了,下次有时间继续填异常处理的坑。

    老规矩:有需要这部分代码的同志可以给我发邮件,大概介绍一下自己,然后说明要这部分代码就好了,当然了,开发者的KEY我可是不会给的,自己去申请吧。邮箱1373415867@qq.com

    相关文章

      网友评论

          本文标题:先来爬爬POI_续

          本文链接:https://www.haomeiwen.com/subject/ntvsxxtx.html