美文网首页
python爬取pm2.5数据

python爬取pm2.5数据

作者: 梦vctor | 来源:发表于2019-03-20 14:42 被阅读0次

requests是python实现的简单易用的HTTP库
最简单常用的方法get()和post()

requests.get()用于请求目标网站,类型是一个HTTPresponse类型

爬取目标是http://www.pm25.in网页的数据,

image.png

1、首先导入第三方库requests

import requests

2、获得目标网站的url,这里各城市数据不尽相同,自行控制

city_pinyin = input('请输入城市拼音:')
url = 'http://www.pm25.in/' + city_pinyin

3、发起请求获取网页内容

def get_html_text(url):
    '''
        返回url的文本
    '''
    r = requests.get(url, timeout=30)
    # print(r.status_code)  
    return r.text

4、自定义规则获取需要的内容信息

aqi_div = '''<div class="span12 data">
        <div class="span1">
          <div class="value">
            '''
index = url_text.find(aqi_div)
begin_index = index + len(aqi_div)
end_index = begin_index + 3
aqi_val = url_text[begin_index:end_index]

5、自定义输出格式,将爬取的实时数据输出

print('空气质量为:{}'.format(aqi_val))

爬取各城市空气质量数据的python完整代码如下:

import requests


def get_html_text(url):
    '''
        返回url的文本
    '''
    r = requests.get(url, timeout=30)
    # print(r.status_code)
    return r.text


def main():
    '''
        主函数
    '''
    city_pinyin = input('请输入城市拼音:')
    url = 'http://www.pm25.in/' + city_pinyin
    url_text = get_html_text(url)
    # print(url_text)

    aqi_div = '''<div class="span12 data">
        <div class="span1">
          <div class="value">
            '''
    index = url_text.find(aqi_div)
    begin_index = index + len(aqi_div)
    end_index = begin_index + 3
    aqi_val = url_text[begin_index:end_index]
    print('空气质量为:{}'.format(aqi_val))

if __name__=='__main__':
    main()

相关文章

  • python爬取pm2.5数据

    requests是python实现的简单易用的HTTP库最简单常用的方法get()和post() requests...

  • Python学习

    python爬虫(五) python爬虫爬取豆瓣电影Top250数据 利用python爬取豆瓣电影TOP250页面...

  • Python学习

    python爬虫(四) python爬虫爬取豆瓣电影数据 今天我们爬取一下豆瓣电影TOP250页面电影的数据,依然...

  • 【二】PYTHON爬取全国新房房价与浅析

    【一】学PYTHON及爬虫的一些总结 【二】PYTHON爬取全国新房房价与浅析 PART ONE:【数据采集】爬取...

  • Python 3 爬取城市历史PM2.5数据

    写在前面: 基于python版本3,使用BeautifulSoup和requests库。因为近来成都的雾霾越来越严...

  • Python爬取PM2.5数据并入mysql库

    爬取网站:http://www.pm25.in/jiangyin[http://www.pm25.in/jiang...

  • Python爬虫:如何爬取分页数据?

    上一篇文章《产品经理学Python:如何爬取单页数据?》中说了爬取单页数据的方法,这篇文章详细解释如何爬取多页数据...

  • python 爬虫框架scrapy

    由于公司最近要写一个数据爬取工具,以前没接触过python 使用原生python 开发了一套携程国内酒店数据爬取,...

  • 利用python爬取股票交易数据

    利用python爬取股票交易数据 分析网站 找到返回的url 爬取股票交易数据 思路,我们利用request来请求...

  • python爬取数据

    嘿,今天的你过的还好吗,今天学习一下python如何爬取网页数据 用到了两个包 requests bs4 如果lx...

网友评论

      本文标题:python爬取pm2.5数据

      本文链接:https://www.haomeiwen.com/subject/prvzmqtx.html