从12306的查询说起

作者: 小白猿 | 来源:发表于2017-12-12 15:28 被阅读19次

从12306的查询说起
Python之12306余票查询
12306查询功能测试设计
12306之下单流程解析
12306之余票查询流程解析
12306之登录流程解析
12306抢票脚本开发(四)完善上节课的代码并面向对象
12306抢票脚本开发(五)中文火车站名到火车站代号的转换
12306抢票脚本开发(三)实现一个简单的查询脚本
12306抢票脚本开发(一)提纲

前言叨逼叨

在某培训机构的客服网站看到一篇爬取12306数据的博客，甚是欣喜，但是在实际操作中，有好多的关键点并未给出，比如对站名的中文与英文标示符的转换等等，甚至我一度想利用一些汉子转拼音的框架自己手撸，但是看连接中标识站名的英文参数并不是简单拼音开头字母缩写，而是有一些特定的规则，但是这样的文章在简书上竟有300喜欢，我就放弃了

转机

后来在不死心简书上看到另外一篇文章，感觉要全面的多，但是只有区区十几个赞，深感不公，建议大家看下，链接在此

正题

啰嗦了一堆，进入正题，博客大家自己看下，本篇文章主要是介绍在这篇文章中学到的，以及由这篇文章引起的一些知识

HTTPS

现在好多的网站的url都使用了HTTPS，包括12306，当使用request库进行网络请求的时候会报类似下面的

# Fails: requests.exceptions.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:749)

百度和谷歌了好多，答案不是很多，大多数答案为

import ssl
ssl._create_default_https_context = ssl._create_unverified_context

但是在此项目中并不生效，后来机缘巧合的，在request请求参数的时候，添加以下参数

response = requests.get(url, verify=False)

verify=False简单理解为不去验证HTTPS的请求的真实性，以目前的知识就只能理解到这一层

【参考博客】

正则

看过刚才推荐的博客就知道了在网络请求会将站名的汉字转为英文标识符，这个中英文对照表是通过另外一个网络请求获取的，获取内容格式大致如下

()小括号是需要提取的信息
\u4e00-\u9fa5通过Unicode编码的范围去锁定汉字的范围，汉字的Unicode的范围可以在网上查到
[A-Z] 大写字母的范围
+至少出现一次
re 模块 findall 找出所有符合的数据，返回一个数组，返回格式如下

网友评论

本文标题：从12306的查询说起

本文链接：https://www.haomeiwen.com/subject/wjsgixtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

从12306的查询说起

前言叨逼叨

转机

正题

相关文章

从12306的查询说起

Python之12306余票查询

12306查询功能测试设计

12306之下单流程解析

12306之余票查询流程解析

12306之登录流程解析

12306抢票脚本开发(四)完善上节课的代码并面向对象

12306抢票脚本开发(五)中文火车站名到火车站代号的转换

12306抢票脚本开发(三)实现一个简单的查询脚本

12306抢票脚本开发(一)提纲

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读