美文网首页
网络爬虫-python爬取高德地图地点

网络爬虫-python爬取高德地图地点

作者: 励志的小小李 | 来源:发表于2020-04-29 18:40 被阅读0次

    python爬取你想要的数据,近期由于业务需求,用python爬取了高德地图一些地点的数据,爬出来数据大致情况如下:

    image

    下面是基本流程:

    1、注册成为高德地图API开发者,网址http://lbs.amap.com/(主要是获取自己的keywords [注册流程可以参考这个网址 https://lbs.amap.com/api/webservice/guide/create-project/get-key])。

    2.安装网络爬取第三方库,主要是下面三个(pip install 安装);

        from urllib.parse import **quote**
    
        from urllib import **request**
    
        import **json**
    

    3.创建网络爬虫爬取数据,并对数据进行解析(这块就直接上代码了);

        from urllib.parse import quote
    
        from urllib import request
    
        import json
    
        # import xlwt
    
        web_key = '**********'    #自己高德的地图的key密钥
    
        url = "http://restapi.amap.com/v3/place/text"  
    
        cityname = "南京"      #  自己需要搜索城市
    
        classfiled = "汽车站"   # 自己需要搜索的目的地信息(比如想搜索医院,直接替换成医院即可)
    
        i=0            # 爬取的页面信息,i=2时即爬取第2页的数据。当 result['count']=0 时即此页面已经无信息,爬取所有数据时可以用此终止循环
    
        req_url = **url** + "?key=" + **web_key** + '&extensions=all&keywords=' + quote(**classfiled**) + '&city=' + quote(**cityname**) + '&citylimit=true' +                     '&offset=25' + '&page=' + **str( i) **+ '&output=json'
    
        data = ''
    
        f=request.urlopen(req_url)
    
        data = f.read()
    
        data = data.decode('utf-8')
    
        result=json.loads(data)
    
        #  print(result['count'])   # 等于0时,即代表此页面已经无信息
    
        result['pois'][0]    #显示数据记录格式
    

    处理过会,基本的网页信息就出来了

    image

    以上的数据是以字典的形式打印出来的,把自己需要获取的字段提出出来就可以了:

    
    for i in range(len(result['pois'])):
    
        print('名称:',result['pois'][i]['name']
    
              ,'\n类型:',result['pois'][i]['type']
    
              ,'\n省份:',result['pois'][i]['pname']
    
              ,'\n城市:',result['pois'][i]['cityname']
    
              ,'\n地区:',result['pois'][i]['adname']
    
              ,'\n乡镇:',result['pois'][i]['business_area']
    
              ,'\n详细地址:',result['pois'][i]['address']
    
              ,'\n经纬度:',result['pois'][i]['location']
    
              ,'\n图片链接:',result['pois'][i]['photos'][0]['url']
    
              ,'\n'
    
            )
    

    部分数据结果如下:

    image

    相关文章

      网友评论

          本文标题:网络爬虫-python爬取高德地图地点

          本文链接:https://www.haomeiwen.com/subject/yebnwhtx.html