美文网首页
pm2.5 小型爬虫

pm2.5 小型爬虫

作者: 六价铬 | 来源:发表于2017-02-03 17:56 被阅读0次

    @(Python)[web scrapy|python]

    抓取空气质量信息@www.pm25.in

    仅做测试使用。

    import requests # 引入requests获取网站内容
    import re # 引入re正则表达式模块
    
    url = 'http://www.pm25.in/api/querys/all_cities.json?token=5j1znBVAsnSf5xQyNQyq' # token是该网站的公用API。该地址获取的是所有城市的空气质量信息。
    
    r = requests.get(url) # 获得方式为GET
    
    print(r.text)
    
    inputTxt = re.compile((r'{.*?}') # 分割r.text中每个城市的信息
    cityTxt = re.compile(r'"area":"(.*?)"') # 设置城市字段的提取规则
    pm25Value = re.compile(r'"pm2_5_24h":(\d+)') # 设置24小时内的pm2.5均值字段的提取规则
    
    content = {}
    for i in re.findall(inputTxt, r.text):
        content[re.findall(cityTxt,i)[0]]=re.findall(pm25Value,i)[0] # 创建字典,形式为 city : pm2.5    
    

    @ All rights reserved.

    相关文章

      网友评论

          本文标题:pm2.5 小型爬虫

          本文链接:https://www.haomeiwen.com/subject/gjbdittx.html