美文网首页
“五一”出游堪比春运

“五一”出游堪比春运

作者: SunY7 | 来源:发表于2023-04-16 16:17 被阅读0次

最近2天“五一”假期火车票正式开售,作为春节以来第一个真正意义上的小长假,“五一”旅游市场火爆程度受到市场密切关注。根据多家在线旅游平台数据显示,“五一”火车票“卖爆了”。
“五一”抢火车票堪比春运,多条热门线路火车票秒空,旅游订单同比增长超2000%,值得一提的是,近期凭借烧烤出圈的淄博在“五一”假期期间有望成为“顶流”。多个在线旅游平台“五一”期间高铁热门目的地榜单,淄博均位列前十。4月14日、15日两天,“淄博”火车票搜索增幅位居全国第一。不仅是火车票难抢,现在机票,景点门票,酒店预订都越来越难抢到了。现在已经成为了想去哪里玩而是哪里还可以去玩的地步了。
“五一”出游热城市,景点肯定是大家的首选,但是太热门的地方可能玩的不会很尽兴,因为都是人挤人。。作为网络索引擎组成之一。爬虫可以有效的帮助我们搜索和爬取有用的信息,减少很多的烦恼,比如这里我们可以通过python对马蜂窝数据的搜集和爬取整理出一份适合出游又很比较冷门的景点,这样可以给大家出游前有更多的选择。
直接用爬虫程序访问网站会返回521, 因为网站采用了js加密反爬. 其实就是一个js逆向问题, 我们看到的是521, 实际上是进行了三次访问. 每次访问需要带上上一次的cookie。不仅有js逆向网站还限制ip的多次访问,所以这里我们的解决办法就是爬虫程序加上优质代理ip并带上cookie一起去爬取。实现过程如下:

! -- encoding:utf-8 --

    import base64            
    import sys
    import random

    PY3 = sys.version_info[0] >= 3

    def base64ify(bytes_or_str):
        if PY3 and isinstance(bytes_or_str, str):
            input_bytes = bytes_or_str.encode('utf8')
        else:
            input_bytes = bytes_or_str

        output_bytes = base64.urlsafe_b64encode(input_bytes)
        if PY3:
            return output_bytes.decode('ascii')
        else:
            return output_bytes

    class ProxyMiddleware(object):                
        def process_request(self, request, spider):
            # 代理服务器(产品官网 www.16yun.cn)
            proxyHost = "t.16yun.cn"
            proxyPort = "31111"

            # 代理验证信息
            proxyUser = "16IFRWCZ"
            proxyPass = "254565"

            # [版本>=2.6.2](https://docs.scrapy.org/en/latest/news.html?highlight=2.6.2#scrapy-2-6-2-2022-07-25)无需添加验证头,会自动在请求头中设置Proxy-Authorization     
            request.meta['proxy'] = "http://{0}:{1}@{2}:{3}".format(proxyUser,proxyPass,proxyHost,proxyPort)

            # 版本<2.6.2 需要手动添加代理验证头
            # request.meta['proxy'] = "http://{0}:{1}".format(proxyHost,proxyPort)
            # request.headers['Proxy-Authorization'] = 'Basic ' +  base64ify(proxyUser + ":" + proxyPass)                    

            # 设置IP切换头(根据需求)
            # tunnel = random.randint(1,10000)
            # request.headers['Proxy-Tunnel'] = str(tunnel)

            # 每次访问后关闭TCP链接,强制每次访问切换IP
            request.header['Connection'] = "Close"

相关文章

  • 我已无心工作,只想尽快为祖国母亲庆生!

    距离十一长假还有不足一个星期,想必很多朋友都已规划好出游计划。 奈何我到现在还没买到堪比春运的车票。(你们消停呆在...

  • 五一火车票卖了前年3倍多?车票荒来袭,你抢到五一出游的票了?

    随着4月17日五一小长假的火车票正式开抢,不知道有多少人和我一样看着自己要买的票直接秒光,其被抢的速度堪比往年春运...

  • 杭州游客“占领”黄山,场面堪比春运

    9月4日至5日,举世瞩目的20国集团(G20峰会)领导人第十一次峰会将在浙江杭州召开。那么,从9月1日到7日,杭州...

  • 过节扎堆出游

    节日出游太辛苦了! “五一”四天小长假都扎堆出游,节日有出游气氛。 今天陪表弟一家四口游玩WH动物园。动物园里人比...

  • 五一出游

    距离放假倒计时三天了唷~盆友们想好去哪玩了吗?杭州玩遍了那么周边城市游一波吖~宁波上海无锡扬州南京苏州约起来️❤️...

  • 五一出游

    五一假期出游感想 想着想着,还是来写点感受吧,因为,总说有时间再写,说着说着时间就溜走了,然而什么也没留下,就算当...

  • 五一出游

    这几日,在想着五一去哪里呆着。毕竟一年也就几个假期,眼看,都要六月了。 时间总也抓不住。 最初决定去婺源。 看多了...

  • 五一出游

    对于大学的记忆,浓重的郁金香是不可忘记等我回忆。 每逢清明前后,迎泽公园的郁金香次第花开,生机蓬勃。 毕业至今,近...

  • 五一出游

    五一放假时,我们一家去了黄骅港,我们去看涨潮了。远远地,有一道墙,把大海和我们隔开。墙有半人多高,人们都站在墙上。...

  • 五一出游

    五一放假时,我们一家人去了黄骅港,我们去看涨潮了爸爸还去捉鱼了。然后我们玩累了就去找了一家饭店吃饭。最后我们又回到...

网友评论

      本文标题:“五一”出游堪比春运

      本文链接:https://www.haomeiwen.com/subject/yszfjdtx.html