美文网首页
(番外篇)Python操纵网盘客户端批量离线下载小电影

(番外篇)Python操纵网盘客户端批量离线下载小电影

作者: Seeker_zz | 来源:发表于2017-08-08 11:42 被阅读1166次

    上回(Python实现电影排行榜自动网盘下载(4)Cookies免登录+抓包下载)说到,一段时间内能进行多少次离线下载还是受限于验证码的输入。
    在此有两个解决方案,

    • 见招拆招 通过GUI优化验证码输入
      即使有验证码,在用户一直输入验证码的情况下也是很快的。而且可以借此学习Python是如何做出GUI程序的,学起来也会是很有价值的,参考 实验楼 给Python3爬虫做一个界面 以后有机会可能会写点类似的实验案例。
    • 使用网盘客户端
      这个解决方案的优点就是没有!验!证!码!缺点就是添加的速度视资源而定,如果违规资源较多,可能会导致频繁重启;再有其实这就是个按键脚本,采用模拟鼠标、键盘等操作,感觉比较脑残…

    这篇文章记录了我第二种方法的实验过程,最后测试了几个磁力链接的添加速度,大概是这样的:

    演示

    速度大概是每分钟10个,如果再慢的话从速度上可能第一种方案会是比较好的选择。

    Pywinauto

    先看看简介吧。pywinauto is a set of python modules to automate the Microsoft Windows GUI. At it’s simplest it allows you to send mouse and keyboard actions to windows dialogs and controls.
    嗯,是个Windows的自动化操作工具。
    帮助文档
    要点一个按钮,首先要知道怎么找这个按钮吧?在这里他的一个示例是关于记事本的,学习了一下,大概是通过窗口类名标题来找的元件,说到这里就要用到Spy++(或者Spy++Lite)

    百度网盘的示例

    就这么拖一下就找出来了。
    嘿嘿,初次用这个Pywinauto感觉还挺厉害的,然而我把他用到网盘上的时候…我就蒙蔽了- -,这个离线下载的按钮在Spy++Lite中找不到,换了其他各种找元件的工具都查不出来,Pywinauto输出这个主窗口包含的元件也不管用。网上查了一下这是为什么,可能是这个按钮他丫的就不是个标准的按钮!那该怎么办呢?

    关于按钮的折腾

    这一段着实是瞎折腾,最初的想法并没有成功,最终选择了鼠标模拟,发上来给大家参考参考吧,大家有指正或者好的改进方法快来告诉我呀~(所以大概这段可以跳过了?(划掉)
    网上看到别的一个方案——窗口收到了什么消息,就模拟什么消息;收到了鼠标按下按键这个消息,就模拟这个消息。
    于是又在Spy++里面瞎折腾,先打开百度云主窗口,然后在Spy++里面记录它收到的消息,找到了这么一条

    找到了按下离线下载之后的窗口的句柄 就是这个消息用到了我们需要的句柄
    离线下载这个按钮的功能就是激活这个新建的窗口,那我们拿到这个句柄(相当于窗口的身份)来激活,不就不用管这个按钮了吗?然而这个句柄是如何产生的呢?它到底是在按下按钮的一瞬间产生的,还是在按下之前就存的有呢?在Spy++中从按下鼠标之后截获到的消息并没有返回这个句柄,呵呵,我就天真地暂定它是之前就存的有吧。就算你存的有,那又该怎么找呢?嘿嘿,我想到了CheatEngine来搜索。 新建离线下载窗口的句柄

    哇,这不是有规律嘛!第4位每次+1!
    然而马上我又被打脸了…开个别的窗口再来开它,嗯……(手动再见)


    好吧…我屈服了…就按照按键脚本来写吧…

    后台鼠标消息

    好了,现在开始试着写按键脚本…大致想法就是获得主窗口的句柄,用坐标的方式获得按钮的位置,然后模拟点击。这里可能用按键精灵的抓抓会比较方便。

    拖动到窗口内“离线下载”按钮上 在按键精灵中测试 主窗口句柄为133248

    在这里需要注意按键精灵抓出来的句柄是10进制的。
    测试成功啦,看来可以用这个方法,那就一通写出来吧。

    发送文本

    这里问题就是离线下载的地址填不进去!它就这么默默地看着你,一动不动!


    按键精灵不行,试试Pywinauto?

    移植到Python

    ……别试了,Pywinauto发送文本也不行。它们用的应该都是WIN API,所以应该换个思路了。在这里我的想法是模拟人操作,把地址Ctrl+C一下,然后到文本框Ctrl+V一下。在这里虽然Pywinauto有Ctrl+V,但却没有Ctrl+C(卧槽这是什么操作啊啊啊)还是用win api吧。注意这个SetClipboardData提到了一句,

    必须用NULL结束字符串。使用此格式为ANSI文本。

    所以我们在地址后面加上一句

    .encode('ansi')
    

    否则粘贴过去就是这样的


    此外文本框还有一个坑,像上面那样查询链接失败的话地址就留在那里了,所以应该是Ctrl+A Ctrl+V。而文本框发送Ctrl+A Ctrl+V有的时候会Ctrl莫名奇妙失效,多出来一个a,粘贴过去是amagnet,所以在这里干脆都按照存在文字的情况处理,发送A Ctrl+A Ctrl+V
    下一个窗口。

    成功晋级!

    虽然可以按照偏移点击的方法解决,但同时我发现可以通过Tab Tab Enter的方式完成下载,或许以后遇见坐标偏移量是变化的时候可以尝试这种方法?
    依次用鼠标点击指定坐标的方式到了最后一个窗口了,关掉这个窗口,就是脚本的一个循环啦。

    关掉这个窗口

    总结

    一开始我并不知道Pywinauto有后台鼠标消息,于是写了一个用winapi模拟点击的版本,也放上来吧。

    from pywinauto import application
    import win32api
    import win32gui
    import win32con
    import win32ui
    main_handle=win32ui.FindWindow('BaseGui','欢迎使用百度网盘').GetSafeHwnd()
    client_pos=(516,118)
    tmp = win32api.MAKELONG(client_pos[0], client_pos[1])
    win32gui.SendMessage(main_handle, win32con.WM_ACTIVATE, win32con.WA_ACTIVE, 0)
    win32api.SendMessage(main_handle, win32con.WM_LBUTTONDOWN, win32con.MK_LBUTTON, tmp)
    win32api.SendMessage(main_handle, win32con.WM_LBUTTONUP, win32con.MK_LBUTTON, tmp)
    

    这次实验还是有很多问题,包括Python实现电影排行榜自动网盘下载(3)Selenium离线下载同样出现的欲速则不达,所以最终代码中加入了wait_until;还有下载一定次数之后查询磁力链接没反应,重启客户端可解决;以及各种查询失败、离线下载错误……总之,应对错误的逻辑还有待改进,在这里只是简单的设定为add_task出现问题之后直接重启客户端,即查询不了下载信息就重启。还有其他情况没有处理,包括下载进度为0%,这种任务多了会提醒离线下载任务过多,需要手动清理,如果违规资源较多,可能导致重启频繁,影响速度。代码的话可能需要根据实际运行情况修改超时时间。由于速度过快经常容易查不到句柄啥的,就都用try except括起来了,感觉好丑却很无奈,献丑啦:

    import pywinauto
    import time
    import win32clipboard as w
    import win32con
    from pywinauto.timings import *
    from pywinauto.application import Application
    class baidudisk:
    
        def boot(self):
            path=r'C:\Users\Administrator\AppData\Roaming\Baidu\BaiduNetdisk\BaiduNetdisk.exe'
            #Python3 中Application要加()
            self.baiduapp=Application().start(path)
            try:
                #规定时间内等待程序启动
                wait_until(10,0.25,self.getmainui,True)
            except Exception as e:
                print('Get Main Window ')
                print(e)
    
        def kill(self):
            self.baiduapp.kill()
        def download(self,url):
            #剪切板函数要求数据类型为ANSI
            self.url=url.encode('ansi')
            try:
                wait_until(1,0.25,self.click_newtask,True)
            except Exception as e:
                print('Download button ')
                print(e)
            try:
                wait_until(1,0.25,self.query_newtask,True)
            except Exception as e:
                print('Query')
                print(e)
            try:
                wait_until(4,0.25,self.add_newtask,True)
            except Exception as e:
                print('Add task')
                print(e)
                print('Rebooting...')
                self.baiduapp.kill()
                self.boot()
            try:
                wait_until(3,0.25,self.close_state,True)
            except Exception as e:
                print('State Window')
                print(e)
    
        def click_newtask(self):
            try:
                self.main_ui.click(coords=(516,118))
                return (True)
            except Exception as e:
                print(e)
                return (False)
    
        def query_newtask(self):
            try:
                    newtask_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= "新建离线下载任务窗口")
                    newtask_ui=pywinauto.controls.hwndwrapper.DialogWrapper(newtask_handle)
                    url_ui=newtask_ui.descendants()[0]
                    # url_ui.set_keyboard_focus()
                    w.OpenClipboard()
                    w.EmptyClipboard()
                    w.SetClipboardData(win32con.CF_TEXT, self.url)
                    w.CloseClipboard()
                    url_ui.send_keystrokes('a^a^v')
                    # print(url_ui.element_info)
                    # print(url_ui.get_properties())
                    #添加磁力链接后下载
                    newtask_ui.click(coords=(470,255))
                    return (True)
            except Exception as e:
                print(e)
                return (False)
    
    
        def add_newtask(self):
            try:
                download_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= '新建离线BT任务')
                download_ui=pywinauto.controls.hwndwrapper.DialogWrapper(download_handle)
                download_ui.click(coords=(400,470))
                #可能出现离线下载错误时该窗口不会正常关闭的情况 所以使用try
                try:
                    download_ui.close()
                except:
                    pass
                return (True)
                
            except Exception as e:
                print(e)
                return (False)
    
        def close_state(self):
            try:
                state_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= '离线下载任务列表')
                state_ui=pywinauto.controls.hwndwrapper.DialogWrapper(state_handle)
                state_ui.close()
                return (True)
            except Exception as e:
                print(e)
                return (False)
    
        def getmainui(self):
            try:
                #返回窗口句柄
                self.baidudisk_handle=pywinauto.findwindows.find_window(class_name='BaseGui',title='欢迎使用百度网盘')
                #根据窗口句柄查询对话框
                self.main_ui=pywinauto.controls.hwndwrapper.DialogWrapper(self.baidudisk_handle)
                return (True)
            except Exception as e:
                print(e)
                return (False)
    
    
    
    
    
    
    if __name__=='__main__':
        bdtest=baidudisk()
        bdtest.boot()
        #正常与违规的链接均进行测试
        magnets=[
            'magnet:?xt=urn:btih:583bed331c32889897f69b114191c44732bb7aa2',
            'magnet:?xt=urn:btih:FD351CACF9692E1833388B3B5A568C6A115E4672&xl=546661540&dn=[%E6%A5%9A%E9%97%A8%E7%9A%84%E4%B8%96%E7%95%8C].rmvb',
            'magnet:?xt=urn:btih:F77F5133B209D29126812CFAC9B0FE2508DC52A9&xl=584113510&dn=%E9%9C%B8%E7%8E%8B%E5%88%AB%E5%A7%AC.rmvb',
            'magnet:?xt=urn:btih:E2A87A1922139C5C44965B77F5EC21F1442C97A4&xl=1073579448&dn=#_IBW118',
            'magnet:?xt=urn:btih:CC2711AE1A5CCB8CB5FB3E6F900F404BD4792517&xl=1367609104&dn=%E9%98%BF%E7%94%98%E6%AD%A3%E4%BC%A0.[1024%E5%88%86%E8%BE%A8%E7%8E%87].rmvb'
        ]
        for i in range(20):
            bdtest.download(magnets[i%5])
    
    

    关于如何批量获取磁力链接地址可参阅往期系列文章:
    Python实现电影排行榜自动网盘下载(4)Cookies免登录+抓包下载
    Python实现电影排行榜自动网盘下载(3)Selenium离线下载
    Python实现电影排行榜自动网盘下载(2)Scrapy深入 “打包员”“快递员”
    Python实现电影排行榜自动网盘下载(1)Scrapy爬虫框架
    Python实现电影排行榜自动网盘下载(0)简介
    网易云音乐评论抓取实验(1)接口获取

    相关文章

      网友评论

          本文标题:(番外篇)Python操纵网盘客户端批量离线下载小电影

          本文链接:https://www.haomeiwen.com/subject/wdywlxtx.html