美文网首页
关于selenium遇到控件的问题

关于selenium遇到控件的问题

作者: hellodyp | 来源:发表于2018-09-03 16:43 被阅读0次

    常规的网页抓取或者设计简单的js加密都可以很好的用http客户端模拟出来

    但是如果安全性高一些的网站,比如银行、酒店信息、某些工商网站的信息,这些站点的反扒措施往往做的比较好,其中一种比较头疼的方式就是控件问题了,很多银行都使用了安全控件的加密措施

    模拟请求的话,无法定位到input输入框,即便用selenium也无法定位

    这里就涉及到windows的机制了,windows中每个窗口对象都有一个句柄标识符,用整型来标识不同的句柄,可以调用win32的库去通过句柄,定位到控件框

    from ctypes import windll
    
    u32 = windll.LoadLibrary('user32.dll')
    

    注意user32.dll文件,windows系统自带的调用接口,里面的一些api,可以通过句柄定位到对应的输入框

    切换输入框的api:

          def switch_to_hwnd(hwnd):
            assert type(hwnd) == int
            u32.SwitchToThisWindow(hwnd, True)
    

    其中hwnd为int类型,表示定位的句柄框

    以上解决了第一个难题,接下来试着向控件框中输入字符,就麻烦了,selenium的driver.send_keys方法只能向普通的dom输入框输入字符,无法输入控件

    这里就需要键盘模拟程序来解决问题了,windows自带了一个软件盘,尝试调用自带软键盘输入,控件框并不能接收到字符,应该是一种安全措施,普通的输入无法向输入框中输入字符

    推荐的方案是,调用winIO库,使用更加底层的机制,该库是c++实现的,python有对应的封装:
    https://pypi.org/project/rabird.winio/
    pypi有具体的使用方法

    pypi给出示例代码也很清晰,接口基本上已经封装好了

      def key_press(scancode, press_time=0.2):
        key_down(scancode)
        time.sleep(press_time)
        key_up(scancode)
    

    调用这个函数就可以,其中scancode是键盘信号映射,推荐把它放到字典中调用,可以从网上搜索到:

    WIO_CODE = {
      'backspace': 0x0E, 'tab': 0x0F, 'enter': 0x1C, 'caps_lock': 0x3A, 'esc': 0x01,
      'spacebar': 0x39, '0': 0x0B, '1': 0x02, '2': 0x03,  '3': 0x04, '4': 0x05,
      '5': 0x06, '6': 0x07, '7': 0x08, '8': 0x09, '9': 0x0A, 'a': 0x1E, 'b': 0x30,
      'c': 0x2E, 'd': 0x20, 'e': 0x12, 'f': 0x21, 'g': 0x22, 'h': 0x23, 'i': 0x17,
      'j': 0x24, 'k': 0x25, 'l': 0x26, 'm': 0x32, 'n': 0x31, 'o': 0x18, 'p': 0x19,
      'q': 0x10, 'r': 0x13, 's': 0x1F, 't': 0x14, 'u': 0x16, 'v': 0x2F, 'w': 0x11,
      'x': 0x2D, 'y': 0x15, 'z': 0x2C, 'F1': 0x3B, 'F2': 0x3C, 'F3': 0x3D,
      'F4': 0x3E,'F5': 0x3F, 'F6': 0x40, 'F7': 0x41, 'F8': 0x42, 'F9': 0x43, 
      'F10': 0x44, 'F11': 0x57, 'F12': 0x58, 'num_lock': 0x45, 'scroll_lock': 0x46, 
      'left_shift': 0x2A, 'right_shift ': 0x36,'left_control': 0x1D, ',': 0x33,
      '-': 0x0C,'.': 0x34, '/': 0x35, '`': 0x29, ';': 0x27,  '[': 0x1A,']': 0x1B,
    }
    

    遍历要输入的字符串,调用key_press方法即可,大写字母输入要press一下CapsLock, 可以封装一下具体输入方法:

    def input_key(element):
        upper = 'QWERTYUIOPASDFGHJKLZXCVBNM'
        # key_press(WIO_CODE['left_shift'])
        if element in upper:
            key_press(WIO_CODE['caps_lock'])
            time.sleep(0.1)
            key_press(WIO_CODE[element.lower()])
            time.sleep(0.1)
            key_press(WIO_CODE['caps_lock'])
        else:
            if element not in WIO_CODE:
                print('error input char')
                return False
            key_press(WIO_CODE[element])
            time.sleep(0.1)
        return True
    

    这样,基本的问题就都解决啦

    相关文章

      网友评论

          本文标题:关于selenium遇到控件的问题

          本文链接:https://www.haomeiwen.com/subject/bhqiwftx.html