美文网首页我爱编程
用python写爬虫-5.处理json

用python写爬虫-5.处理json

作者: ddm2014 | 来源:发表于2018-04-12 16:19 被阅读0次

前面处理的多还是结构化的信息,对于返回的json就要用另外的模块了。
还是12306的获取的信息,地址已经在用python写爬虫-2.2requests库之post说明了。

这是一个json,json看起来就是一个dict,但是type是str,怎么能够清楚的看到返回json的结构呢,还是F12.


image.png

在这里我们可以清楚的看到,我们需要的信息。
然后就可以解析了,这次还是用pandas,分解这些在一起的内容很容易。
代码如下:

import json
import requests
import pandas as pd
def xhr():
    url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2018-04-23&leftTicketDTO.from_station=XNO&leftTicketDTO.to_station=GRO&purpose_codes=ADULT'
    re =requests.get(url).text
    res = json.loads(re)
    list = [item.split('|') for item in res['data']['result']]
    df = pd.DataFrame(data=list)
    print(df)

res = json.loads(re)是把返回的json转为dict。dict就能用key来提取信息。
list = [item.split('|') for item in res['data']['result']]
用split来分离一条信息的各项内容。
df = pd.DataFrame(data=list)转为dataframe。好观察。
结果如下:


image.png

相关文章

网友评论

    本文标题:用python写爬虫-5.处理json

    本文链接:https://www.haomeiwen.com/subject/niaxkftx.html