终端查询12306余票

作者: Torival | 来源:发表于2016-10-09 22:23 被阅读1100次
    运行展示

    环境搭建

    • 本次实验是在Python3的环境下完成的,如果电脑里面没有python的话,根据自己所使用的平台(Windows,Linux,Mac),这里下载。如果已经安装了python的,查看一下python版本,确保版本是3.x的。
    $ python -V
    Python 3.5.1
    
    • 确保环境中已经存在pip3。如果没有,参考这个:安装pip

    • 安装实验需要用到的库:

    $ sudo pip3 install requests prettytable docopt
    

    requests: 使用 Python 访问 HTTP 资源的必备库
    docopt :Python3 命令行参数解析工具
    prettytable: 格式化信息打印工具,能让你像 MySQL 那样打印数据。就是展示所对齐的表格

    实现思路

    • 第一步,我们来看看买票的这个过程。
    买票

    我们在买的时候,输入了出发地目的地出发日,还点了一个查询。假设,我们把这个过程看作是一个函数的话,那么对于它的所有操作相当于是输入,通过一些系列对输入的处理。获取我们想要的查询结果,即输出

        ...
        # docopt 可以按我们在注释中定义的格式来解析参数
        arg = docopt(__doc__)
        
        # 出发地:例如,大连
        from_station = station.get(arg['<from>'])
        
        # 目的地:例如,北京
        to_station = station.get(arg['<to>'])
        
        # 时间:例如,2016-10-10
        date = arg['<date>']
        ...
    
    • 第二步,分析查询按钮,如果你使用 Chrome浏览器,那么按 F12 打开开发者工具,选中 Network 一栏,在查询框中我们输入 大连北京,日期 2016-10-10, 点击查询,我们在调试工具可以发现,查询系统实际上请求了这个URL:
    https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-10-10&from_station=DLT&to_station=BJP
    
    查询URL
    • 第三步,我们发现里面有三个变量对应我们输入的参数:queryDatefrom_stationto_station,可是是以某种代号进行传递。查看网页源代码,我们发现一个文件,里面记录着所有地点信息,是以JSON格式保存。那么,我们可以通过正则表达式,分割字符串,建立一个字典。这样就可以通过我们所输入的汉语地名找到对应的代号。

      车站信息
    • 第四步,这一步也就是最关键的一步了,找到我们需要的信息,然后解析它。再次,查看调试工具里面的信息。OK,所需要的信息找到了。接下来就是漂亮的展示出来了。


      JSON数据

    参考资料

    代码(200行内):
    github:https://github.com/Torival/BlogCode/tree/master/buy%20ticket
    其他:
    实验楼:https://www.shiyanlou.com/courses/623

    如果是在linux平台,赋权后,可以直接执行。

    $ sudo chmod +x tickets.py
    $ ./tickets.py 大连 北京 2016-10-10
    

    相关文章

      网友评论

        本文标题:终端查询12306余票

        本文链接:https://www.haomeiwen.com/subject/riqmyttx.html