Python可以做哪些好玩的事之自动刷票

作者: 一只写程序的猿 | 来源:发表于2017-09-14 17:48 被阅读726次

    目标网站:http://best.zhaopin.com/?sid=121128100&site=sou

    1.分析

    • 先手动投票查看网页提交的请求
    点击投票网页提交的请求 投票成功返回的json数据,可以看到是result:1 为公司投票时提交的参数
    点击'为我点赞'网页提交的请求 点赞时提交的参数

    通过分析可以看到网页实际上并没有针对同一IP的投票进行限制,所以不需要进行使用代理IP,但是为了使我们的代码更加符合常规网站的对同一IP限制投票的机制,所以这里抓取一个代理IP的网站进行点击投票

    提供不错几个的短期代理IP网站

    但是,这些免费开放代理一般会有很多人都在使用,而且代理有寿命短,速度慢,匿名度不高,HTTP/HTTPS支持不稳定等缺点(免费没好货)。

    查看网页结构每一个代理IP和端口都在一个<td></td>标签中,我们可以通过正则筛选出我们想要的结果

    2.小试牛刀(代码基于Python 2.7)

    #-*- coding:utf-8 -*-
    
    import requests
    import json
    import re
    import random
    import sys
    import time
    import datetime  #处理日期和时间的标准库
    import threading  #引入多线程
    from random import choice  #choice() 方法返回一个列表,元组或字符串的随机项
    from bs4 import BeautifulSoup
    from fake_useragent import UserAgent #引入userAgent
    
    
    def get_ip():
        '''获取代理IP'''
        url = 'http://www.xicidaili.com/nn'
        my_headers = {
            'Accept': 'text/html, application/xhtml+xml, application/xml;',
            'Accept-Encoding': 'gzip, deflate, sdch',
            'Accept-Language': 'zh-CN,zh;q=0.8',
            'Referer': 'http: // www.xicidaili.com/nn',
            'User-Agent': 'Mozilla / 5.0(Windows NT 6.1;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 45.0.2454.101Safari / 537.36'
        }
        r = requests.get(url,headers=my_headers)
        soup = BeautifulSoup(r.text,'html.parser')
        data = soup.find_all('td')
    
        #定义IP和端口Pattern规则
        ip_compile = re.compile(r'<td>(\d+\.\d+\.\d+\.\d+)</td>')  #匹配IP
        port_compile = re.compile(r'<td>(\d+)</td>')  #匹配端口
        ip = re.findall(ip_compile,str(data))    #获取所有IP
        port = re.findall(port_compile,str(data))  #获取所有端口
        z = [':'.join(i) for i in zip(ip,port)]  #列表生成式
        print z
        #组合IP和端口
        return z
    
    # 设置user-agent列表,每次请求时,随机挑选一个user-agent
    ua_list = UserAgent()
    print ua_list.random
    
    def get_url(url,code=0,ips=[]):
        '''
        投票
        如果因为代理IP已失效造成投票失败,则会自动换一个代理IP后继续投票
        :param code:
        :param ips:
        :return:
        '''
        try:
            ip = choice(ips)
        except:
            return False
    
        else:
            #指定IP
            proxies = {
                'http':ip
            }
            headers = {
                'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
                'Host': 'best.zhaopin.com',
                'Origin': 'https: // best.zhaopin.com',
                'Referer':'https//best.zhaopin.com/?sid=121128100&site=sou',
                # 'User-Agent':choice(ua_list)
                'User-Agent': ua_list.random
            }
            print ua_list.random
    
        try:
            data = {"bestid": "3713", "score": "5,5,5,5,5,5","source": "best",}
    
            result = requests.post(url=url,data=data, proxies=proxies,)  # 跳过证书的验证 verify=False
        except requests.exceptions.ConnectionError:
            print 'ConnectionError'
            if not ips:
                print 'ip 已失效'
                sys.exit()
            #删除不可用的代理IP
            if ip in ips:
                ips.remove(ip)
            #重新请求url
            get_url(url,code=0,ips=[])
        else:
            date = datetime.datetime.now().strftime('%H:%M:%S')
            # result.text() 投票成功显示1  失败显示0
            print u"第%s次 [%s] [%s]:投票%s (剩余可用代理IP数:%s)" % (code, date, ip, result.text, len(ips))
    
    def get_num(num):
        #点赞的请求
        url1 = 'https://best.zhaopin.com/API/Vote.ashx'
        #投票的请求
        url2 = 'https://best.zhaopin.com/API/ScoreCompany.ashx'
        if num == 1:
            url=url1
            main(url)
        elif num == 2:
            url =url2
            main(url)
        else:
            print '您的输入有误,请重新输入!!!'
            num = int(raw_input('自主刷赞请选1,自动投票请选2:'))
            get_num(num)
    
    
    def main(url):
        ips = []
        #xrange() 生成的是一个生成器
        for i in xrange(6000):
            # 每隔1000次重新获取一次最新的代理IP,每次可获取最新的100个代理IP
            if i % 1000 == 0:
                ips.extend(get_ip())
                print '--------------------------------------'
                print ips
            #启动线程,每隔1s产生一个线程,可通过控制时间加快投票速度
            t1 = threading.Thread(target=get_url,args=(url,i,ips))
            t1.start()
            time.sleep(1)  #time.sleep的最小单位是毫秒
    
    
    
    
    if __name__ == '__main__':
        # #点赞的请求
        # url1 = 'https://best.zhaopin.com/API/Vote.ashx'
        # #投票的请求
        # url2 = 'https://best.zhaopin.com/API/ScoreCompany.ashx'
        print '欢迎使用自助刷票小工具QAQ'
        num = int(raw_input('自主刷赞请选1,自动投票请选2:'))
        get_num(num)
    
    
    • 运行程序
    开启程序,可以看到每次投票的IP已不再是我们本机IP

    相关文章

      网友评论

      • 2171cf8faaf6:话说微信上投票,需要关注公众号再投票,这个思路可以这篇文章不,最近特别多宝宝参赛投票类消息
        一只写程序的猿:@cevoly 我其实一直卡在有些微信投票网站需要在手机端打开,有时间也想好好研究下手机端抓包试下
      • 王小鱼鱻:这样刷,确定不会被查出来?
        一只写程序的猿:@疯魔的小咸鱼 只是为了验证是否可以通过爬虫来刷票,查的话肯定可以查出来的。
      • 一只写程序的猿:代码中很多地方是可以优化的,后续花时间优化了代码,使用了python封装的库,大概减少了20行左右代码,有不足的地方希望大家一块交流。最后说一句,python的库真强大。。。
      • dalalaa:不错:+1:
        一只写程序的猿:@dalalaa 理论上可以
        dalalaa:@_知几 微信能这样刷吗?
        一只写程序的猿:@dalalaa 谢谢
      • Mo丶染洛凉:假设输入错误,最下面的else会跳转至重新输入?不是直接结束了吗
        一只写程序的猿:@Mo丶染洛凉 谢谢指出 我改下

      本文标题:Python可以做哪些好玩的事之自动刷票

      本文链接:https://www.haomeiwen.com/subject/vavdsxtx.html