美文网首页
先来爬爬POI_续

先来爬爬POI_续

作者: Giser1993 | 来源:发表于2017-05-20 21:44 被阅读0次

原文再续,书接上回

上一回是博主的处女作,大概讲了一下怎么用高德地图的API爬取POI数据。运行结果基本上就下边这样的:

上一篇的运行结果

发出去以后,有同学给我吐槽,说这个运行结果用着有点麻烦,想存成文件后边好用。想想也对,今天就给大家写一下怎么把解析好的数据存成文件,后边好用。

要存文件,首先呢,要创建一个文件。今天呢,我们就用最简单最常用的txt文件来写吧(主要是作者习惯了用txt)。创建一个txt文件也很简单,一句代码搞定

poifile=open("POI.txt","wb")

open函数的各个参数的具体含义,大家有兴趣可以自行百度,我在这就不多说了。

好了文件创建好了,下边就该把数据写到文件里边了,还是一句代码

poifile.write(poi["name"] +","+ poi["type"] +","+ poi["location"] +"\n")

写到这里是不是大家觉得可以了,就两句代码嘛,还值得写一篇。哈哈哈,你么啊,还是Too Young Too Naive。借用一位不可提及名字的人的话“有必要告诉你们一些人生的经验了!!!”。

直接写这两句话上去的话,运行结果是这样的

啦啦啦啦报错了报错了

到这步,其实你已经掉进py的坑里了。中文编码啊,当时我刚开始撸py的时候,中文编码也是把我虐的死去活来的。这又是一段心酸历史,有机会再说。

不过呢,写py有一个原则,遇到问题就找包,管他好包坏包,能解决问题就是好包。通过万能某度,我又找到了一个神包codecs。好了,把创建文件的代码改一下

poifile=codecs.open("POI.txt","wb","utf-8")

好了,运行走起。

结果

到这,你已经可以调用高德的API爬一定区域内你想要的POI数据了,数据到手后再怎么分析,我就不太懂了,结合业务具体搞吧。文末,引用一下老吴的话

      在高德API上进行。这不算一种正统的爬虫,因为爬虫的技巧和乐趣在于和被爬的网站进行博弈,要么你被封号封IP,要么你获得网页上有用的信息。而高德API及其类似的API,就像你要强奸她时,她反而大大方方把衣服解开,说您看,这是胸,这是腰,还有这是臀,您想模哪请自便。情趣立减三分!

     所以想提高爬虫技能,API不算是一个好老师,我个人的理解。

好了,写文件的坑填完了,下次有时间继续填异常处理的坑。

老规矩:有需要这部分代码的同志可以给我发邮件,大概介绍一下自己,然后说明要这部分代码就好了,当然了,开发者的KEY我可是不会给的,自己去申请吧。邮箱1373415867@qq.com

相关文章

  • 先来爬爬POI_续

    原文再续,书接上回 上一回是博主的处女作,大概讲了一下怎么用高德地图的API爬取POI数据。运行结果基本上就下边这...

  • 先来爬爬POI_再续

    原文再续,书接上回 前几天一直在忙工作的事情,没有来填坑,给大家数据抱歉。 上一篇讲了一下怎么把文件保存下来,倒是...

  • 先来爬爬POI

    首先呢,先要把python的环境给安装好,然后选个好的IDE,推荐使用pycharm。(刚才有大佬说Eclipse...

  • 爬爬爬爬爬爬爬

    爬爬爬爬爬爬爬 只要你爬得足够高 人们便会觉得你如飞在云端般轻飘

  • 宝贝爬爬为何如此重要

    相信宝妈们很多都听过关于宝宝爬爬敏感期了。 那什么是宝宝爬爬敏感期?这个阶段为何如此重要? 那我先来解释一下何为敏...

  • 爬旺山(续)

    在古城墙上休息一会,看到有下山的人钻过城墙,问他们到山顶还有多远?他们说大约还有二百米,说明还有一段路呢。 上吧,...

  • 2018-08-14

    Windows环境下Scrapy的断点续爬、增量爬取、断网急救 (2017-10-27 22:50:32) 转载▼...

  • 我爬爬爬

    2018年1月16日,我半岁了。这天妈妈又折腾了,她说“今天宝宝来学习一下爬爬。”她才不管什么“二抬四翻六坐七滚八...

  • 华山爬爬爬!!!

    7:00到8:00 到第一关 五里关 感觉整个山都在跟我蒸桑拿,它起雾,我出汗! 在桃林道院把羊毛开衫脱掉!顿时觉...

  • 新奇爬爬爬

网友评论

      本文标题:先来爬爬POI_续

      本文链接:https://www.haomeiwen.com/subject/ntvsxxtx.html