jsonpath

作者: 不咸的Yan | 来源:发表于2019-08-16 08:51 被阅读0次
    • jsonpath

    用于处理爬虫爬取的json结构化数据


    from jsonpath import jsonpath
    import requests
    import jsonpath
    import json
    
    # 获取拉勾网城市json字符串
    url = 'http://www.lagou.com/lbs/getAllCitySearchLabels.json'
    headers = {"User-Agent": "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)"}
    response =requests.get(url, headers=headers)
    html_str = response.content.decode()
    
    # 把json格式字符串转换成python对象
    jsonobj = json.loads(html_str)
    
    # 从根节点开始,获取所有key为name的值
    citylist = jsonpath.jsonpath(jsonobj,'$..name')
    
    # 写入文件
    with open('city_name.txt','w') as f:
        content = json.dumps(citylist, ensure_ascii=False)
        f.write(content)
    

    相关文章

      网友评论

          本文标题:jsonpath

          本文链接:https://www.haomeiwen.com/subject/ysgxsctx.html