美文网首页大数据 爬虫Python AI Sql互联网科技程序员
4 行 Python 代码获取所在城市的天气预报!

4 行 Python 代码获取所在城市的天气预报!

作者: 919b0c54458f | 来源:发表于2019-04-09 20:06 被阅读12次

使用Python获取天气预报,想想是件很简单的事情。无非是发送一个HTTP请求,再解析请求返回的结果。当你真的使用Python程序去获取天气预报以后,会发现,有不少坑在等着你。这里简单记录一下我遇到的坑,供大家参考。

如何获取

使用Python获取天气有两种不同的方法,一种是像平时爬虫一样,获取天气预报网站的HTML页面,再使用XPath或BeautifulSoup解析HTML页面的内容。这是比较传统的爬虫方式。此外,还有另外一种比较合适的方法——通过天气预报网站提供的API。通过API,直接获取结构化的数据,省去了解析HTML的烦恼。

使用API

搜索"天气预报 API"这两个关键字,会有很多相关的内容,例如,这个

https://wwwzhihu.com/question/20575288

答案下就列出了不少提供API访问天气预报的网站。

然而,大部分都已经不可用了。部分可用的需要收费或者需要注册,都比较麻烦。有没有比较省事的方案呢?找来找去,我找到了中国天气网的API。无需注册直接可用,返回json格式的数据,无需使用BeautifulSoup或XPath解析,非常的方便。赞!

Python学习群:556370268,有大牛答疑,有资源共享!有想学习python编程的,或是转行,或是大学生,还有工作中想提升自己能力的,正在学习的小伙伴欢迎加入学习。

例如,可以直接访问下面的地址,在浏览器中查看中国天气网返回的json数据:

http://www.weather.com.cn/data/sk/101020100.html

有了API处理起来就很简单了,直接使用Python世界最知名的requests访问API即可。

安装requests:


pip install requests

</pre>

检查安装是否成功:

<pre style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: 0.544px; orphans: auto; text-align: justify; text-indent: 0px; text-transform: none; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px; color: rgb(169, 183, 198); font-family: Consolas; font-size: 9.8pt; background-color: rgb(43, 43, 43);">

python -c "import requests"

</pre>

使用ipython测试:

<pre style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: 0.544px; orphans: auto; text-align: justify; text-indent: 0px; text-transform: none; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px; color: rgb(169, 183, 198); font-family: Consolas; font-size: 9.8pt; background-color: rgb(43, 43, 43);">

In [1]: import requests
In [2]: r = requests.get('http://www.weather.com.cn/data/sk/101020100.html')
In [3]: r.status_code
Out[3]: 200

In [4]: r.content
Out[4]: '{"weatherinfo":{"city":"ä¸�æµ·","cityid":"101020100","temp":"15","WD":"ä¸�é£�","WS":"1级","SD":"50%","WSE":"1","time":"17:08","isRadar":"1","Radar":"JC_RADAR_AZ9210_JB","njd":"æ��æ� å®�å�µ","qy":"1020","rain":"0"}}'

In [5]: r.json()
Out[5]: {u'weatherinfo': {u'Radar': u'JC_RADAR_AZ9210_JB',
  u'SD': u'50%',
  u'WD': u'��',
  u'WS': u'1级',
  u'WSE': u'1',
  u'city': u'�海',
  u'cityid': u'101020100',
  u'isRadar': u'1',
  u'njd': u'æ��æ� å®�å�µ',
  u'qy': u'1020',
  u'rain': u'0',
  u'temp': u'15',
  u'time': u'17:08'}}

</pre>

requests库包含一个名为json的方法,当请求的地址返回的是json格式的数据时,直接使用该方法访问即可,无需使用标准库的json库。

### 解决乱码

如果大家刚才在浏览器中打开了我给的地址,会发现,输出结果是乱码的。如下所示: 

![image](https://img.haomeiwen.com/i12649257/0d30d34e94aa19ec?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

我们可以在ipython中,查看数据编码:

<pre style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: 0.544px; orphans: auto; text-align: justify; text-indent: 0px; text-transform: none; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px; color: rgb(169, 183, 198); font-family: Consolas; font-size: 9.8pt; background-color: rgb(43, 43, 43);">

In [6]: r.encoding
Out[6]: 'ISO-8859-1'

</pre>

我们知道,乱码是因为解码的字符集与编码的字符集不一样,所以才会有乱码。那么,我们怎么知道数据的编码字符集呢?这个时候就靠猜了。众所周知,utf-8因为各种优点(如果大家感兴趣,我可以写一篇字符集编码的文章),是使用最广泛的字符集编码,因此,我们可以尝试使用utf-8进行解码。如下所示:

<pre style="margin: 0px; padding: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: 0.544px; orphans: auto; text-align: justify; text-indent: 0px; text-transform: none; widows: 1; word-spacing: 0px; -webkit-text-stroke-width: 0px; color: rgb(169, 183, 198); font-family: Consolas; font-size: 9.8pt; background-color: rgb(43, 43, 43);">

In [7]: r.json()['weatherinfo']['city']
Out[7]: u'�海'

In [8]: '�海'.decode('utf-8')
Out[8]: u'上海'

In [9]: print '�海'.decode('utf-8')

上海

可以看到,使用utf-8解码以后,可以正确的显示数据。也就是说,中国天气网返回给我们的数据,应该是utf-8格式的。那么,为什么会乱码呢?这可能是中国天气网的工程师水平不行,也可能是故意不想让我们使用,谁知道呢。

我们已经知道了正确的编码,接下来,只要将相应的数据,使用utf-8格式解码即可。requests库本身提供了这样的功能,如下所示:

In [10]: r.encoding = 'utf-8'
In [11]: print r.json()['weatherinfo']['city']

上海

获取不同城市的天气预报

前面的例子,获取的是上海的天气预报。如果想要使用中国天气网的API,获取其他城市的天气预报呢?中国天气网并没有提供相应的接口,我们只能自己想办法。

在我们测试的URL中,101020100是城市的代码,我们只需要找到其他城市的代码,将101020100替换成相应的代码即可。查找方法是,在中国天气网的首页,搜索城市的名称,地址栏中会显示相应城市的代码。如下所示:

image

4 行Python代码获取天气预报

使用Python获取天气预报的例子中,我们的主要任务在于找到相应的API,解决字符集编码问题。当这些问题解决以后,直接使用requests库获取天气预报即可。下面是获取所在城市天气预报的4行Python代码:

In [1]: import requests
In [2]: r = requests.get('http://www.weather.com.cn/data/sk/101020100.html')
In [3]: r.encoding = 'utf-8'
In [4]: print r.json()['weatherinfo']['city'], r.json()['weatherinfo']['WD'], r.json()['weatherinfo']['temp']

上海 东风 15

相关文章

网友评论

    本文标题:4 行 Python 代码获取所在城市的天气预报!

    本文链接:https://www.haomeiwen.com/subject/xgtwiqtx.html