Selenium+PhantomJS自动续借图书馆书籍(上)

作者: mrlevo520 | 来源:发表于2016-08-06 11:26 被阅读205次

    Python 2.7
    IDE Pycharm 5.0.3

    具体环境,Selenium及PhantomJS使用等看我前一篇博客
    Python+Selenium+PIL+Tesseract真正自动识别验证码进行一键登录


    吐槽

    自从我欠图书馆6块钱的过期书后,立马要写一个自动续约的小工具压压惊
    

    目的

    自动实现图书馆借书籍的书单截图,并一键续约全部书籍,我登录校图书馆的目的无非就这两个咯,我才不去预约没有的书呢--反正没有一次预约成功过0.0


    实现方法

    Selenium+PhantonJS自动化脚本执行


    实现方案

    1.采用Firefox浏览器进行模拟登录,这个比较酷炫把,可以看着浏览器自己在那边跑,欢快的停不下来。。。
    2.调用PhantomJS.exe,不展现浏览器的运作,直接在cmd窗口跑(用pyinstaller打包成exe后有cmd窗)


    方案实现过程

    1.采用Selenium+Firefox方式:
    先来个最后成品动图:


    实现动图

    (自从剪成动图之后,根本停不下来。更加生动形象有木有!)


    然后来程序代码--主模块(被调用模块,也可单独执行)

    # -*- coding: utf-8 -*-
    #Author:哈士奇说喵
    
    from selenium import webdriver
    import time
    
    #shift-tab多行缩进(左)
    print 'please wait...system loading...'
    #reload(sys)
    
    PostUrl = "http://lib.hrbeu.edu.cn/#"
    
    driver=webdriver.Firefox()#用浏览器实现访问
    #driver = webdriver.PhantomJS(executable_path="phantomjs.exe")#没用浏览器
    driver.get(PostUrl)
    
    elem_user = driver.find_element_by_name('number')
    elem_psw = driver.find_element_by_name('passwd')
    
    
    #选择我的图书馆,点击后才能看到输入账号密码
    click_first = driver.find_element_by_xpath("//ul[@id='imgmenu']/li[4]")
    click_first.click()
    elem_user.send_keys('S315080092')
    elem_psw.send_keys('xxxxxxxxx')
    
    #点击登录
    click_second = driver.find_element_by_name('submit')
    click_second.click()
    print 'log in...'
    time.sleep(1)
    
    #定位新页面元素,将handle重定位即可
    
    driver.switch_to_window(driver.window_handles[1])#定位弹出的第一个页面,也就是当前页面
    #sreach_window = driver.current_window_handle  #此行代码用来定位当前页面#不可行
    driver.find_element_by_xpath("/html/body/div[4]/div/div/ul/li[3]/a").click()
    driver.save_screenshot('image_booklist_firefox.jpg')
    print 'turning to the mylib...'
    time.sleep(1)#搜索结果页面停留片刻
    
    #driver.switch_to_window(driver.window_handles[1])
    #没有跳出新窗口就是在同一页面的!
    for i in range(2,30):#这里限定是29本书,一般我们都不会借那么多书的
        try:
            #driver.find_element_by_xpath("/html/body/div[4]/div/div[2]/table/tbody/%s/td[8]/div/input"%('tr[%s]'%i)).click()#下面的比较好理解
            driver.find_element_by_xpath("/html/body/div[4]/div/div[2]/table/tbody/tr[%s]/td[8]/div/input"%i).click()
            print 'renewing...the %d\'th book renewed '%(i-1)
        except:
            print '%d books have been renewed !'%(i-2)
            a=i-2
            time.sleep(4)
            driver.save_screenshot('image_done_firefox.jpg')
            print 'the picture is saving...'
            print 'done!'
            break
    
    time.sleep(1)
    
    driver.close()
    driver.quit()
    

    调用上述模块的主执行函数(其实就是为了封装上述模块而已,封装成gui界面,为后续的打包做准备,如何打包请见博文将自己的python程序打包成exe(秀同学一脸呐)
    ):

    # -*- coding: utf-8 -*-
    #Author:哈士奇说喵
    
    from Tkinter import *
    import tkMessageBox#执行gui窗
    import time
    
    def check_renew():
        print 'checking and renewing...'
        tkMessageBox.showinfo('提示','即将开启装逼模式,请确认已安装Firefox浏览器')
        #time.sleep(4)
        import Selenium_PhantomJS_lib_firefox
        tkMessageBox.showinfo('提示','已执行成功!\n(截图已保存于程序目录)')
    
    
    
    #主框架部分
    root = Tk()
    root.title('图书馆查询续约(哈尔滨工程大学专版)--by 哈士奇说喵')
    label=Label(root,text='   图书馆一键查询与续约Firefox版本 (✪ω✪)  ')
    button_check=Button(root,text='查询书单并续期━Σ(゚Д゚|||)━开启Firefox有形装逼模式 ',background='green',command=check_renew)
    
    label.pack()
    button_check.pack()
    root.mainloop()
    

    实现效果如图所示:


    实现效果

    程序中的注释相信可以把程序解释的差不多了把。。。。


    遇到问题和解决方案

    1.selenium对新页面元素无法定位抛出

    NoSuchElementException: Message: Unable to locate element
    

    错误,导致无法进行对新的界面进行点击操作。
    1.解决方案:专门写了一篇博客,请见
    解决Selenium弹出新页面无法定位元素问题(Unable to locate element)


    2.对打包后的版本无法运行,抛出如图错误Errno 10054


    错误形式

    2.解决方案:暂未找到解决方案,exe文件不可用,程序执行可用


    3.对未知书籍数目重复点击操作,代码冗余
    3.解决方案:因为点击续借按钮的元素每个都不一样,通过观察可知其中的规律,之后就知道在那进行修改,但是,光修改的话,十本书就有十个相似的代码串,很不pythontic,所以,采用格式化字符串的方式进行for循环带入,方便又漂亮!


    4.使用了1中的解决方案还是不能定位元素
    4.可能查找元素的方式出现错误,我现在的使用方法是采用xpath的方式来找,比如说这样

    driver.find_element_by_xpath("/html/body/div[4]/div/div/ul/li[3]/a")
    

    虽然看起来有点长,但是元素相当好找,而且定位很准,如果采用类似这种driver.find_element_by_xpath("//ul[@id='imgmenu']/li[4]"),我现在还不能很好地驾驭,出错可能性有点大,下次要多进行尝试。


    下篇预告

    实现方案二,调用PhantomJS.exe,不展现浏览器的运作,直接在cmd窗口跑(用pyinstaller打包成exe后有cmd窗)


    PS

    科三过了还的看科四,话说老师十八号要带我去采集数据。。。。。可能就没有多少时间整我的爱好了。。。那么,应该会从数据采集,数据挖掘算法方面进行更新,━Σ(゚Д゚|||)━仍重道远啊喵
    so ,see you tomorrow!good night!


    相关文章

      网友评论

        本文标题:Selenium+PhantomJS自动续借图书馆书籍(上)

        本文链接:https://www.haomeiwen.com/subject/pgyksttx.html