常规的网页抓取或者设计简单的js加密都可以很好的用http客户端模拟出来
但是如果安全性高一些的网站,比如银行、酒店信息、某些工商网站的信息,这些站点的反扒措施往往做的比较好,其中一种比较头疼的方式就是控件问题了,很多银行都使用了安全控件的加密措施
模拟请求的话,无法定位到input输入框,即便用selenium也无法定位
这里就涉及到windows的机制了,windows中每个窗口对象都有一个句柄标识符,用整型来标识不同的句柄,可以调用win32的库去通过句柄,定位到控件框
from ctypes import windll
u32 = windll.LoadLibrary('user32.dll')
注意user32.dll文件,windows系统自带的调用接口,里面的一些api,可以通过句柄定位到对应的输入框
切换输入框的api:
def switch_to_hwnd(hwnd):
assert type(hwnd) == int
u32.SwitchToThisWindow(hwnd, True)
其中hwnd为int类型,表示定位的句柄框
以上解决了第一个难题,接下来试着向控件框中输入字符,就麻烦了,selenium的driver.send_keys方法只能向普通的dom输入框输入字符,无法输入控件
这里就需要键盘模拟程序来解决问题了,windows自带了一个软件盘,尝试调用自带软键盘输入,控件框并不能接收到字符,应该是一种安全措施,普通的输入无法向输入框中输入字符
推荐的方案是,调用winIO库,使用更加底层的机制,该库是c++实现的,python有对应的封装:
https://pypi.org/project/rabird.winio/
pypi有具体的使用方法
pypi给出示例代码也很清晰,接口基本上已经封装好了
def key_press(scancode, press_time=0.2):
key_down(scancode)
time.sleep(press_time)
key_up(scancode)
调用这个函数就可以,其中scancode是键盘信号映射,推荐把它放到字典中调用,可以从网上搜索到:
WIO_CODE = {
'backspace': 0x0E, 'tab': 0x0F, 'enter': 0x1C, 'caps_lock': 0x3A, 'esc': 0x01,
'spacebar': 0x39, '0': 0x0B, '1': 0x02, '2': 0x03, '3': 0x04, '4': 0x05,
'5': 0x06, '6': 0x07, '7': 0x08, '8': 0x09, '9': 0x0A, 'a': 0x1E, 'b': 0x30,
'c': 0x2E, 'd': 0x20, 'e': 0x12, 'f': 0x21, 'g': 0x22, 'h': 0x23, 'i': 0x17,
'j': 0x24, 'k': 0x25, 'l': 0x26, 'm': 0x32, 'n': 0x31, 'o': 0x18, 'p': 0x19,
'q': 0x10, 'r': 0x13, 's': 0x1F, 't': 0x14, 'u': 0x16, 'v': 0x2F, 'w': 0x11,
'x': 0x2D, 'y': 0x15, 'z': 0x2C, 'F1': 0x3B, 'F2': 0x3C, 'F3': 0x3D,
'F4': 0x3E,'F5': 0x3F, 'F6': 0x40, 'F7': 0x41, 'F8': 0x42, 'F9': 0x43,
'F10': 0x44, 'F11': 0x57, 'F12': 0x58, 'num_lock': 0x45, 'scroll_lock': 0x46,
'left_shift': 0x2A, 'right_shift ': 0x36,'left_control': 0x1D, ',': 0x33,
'-': 0x0C,'.': 0x34, '/': 0x35, '`': 0x29, ';': 0x27, '[': 0x1A,']': 0x1B,
}
遍历要输入的字符串,调用key_press方法即可,大写字母输入要press一下CapsLock, 可以封装一下具体输入方法:
def input_key(element):
upper = 'QWERTYUIOPASDFGHJKLZXCVBNM'
# key_press(WIO_CODE['left_shift'])
if element in upper:
key_press(WIO_CODE['caps_lock'])
time.sleep(0.1)
key_press(WIO_CODE[element.lower()])
time.sleep(0.1)
key_press(WIO_CODE['caps_lock'])
else:
if element not in WIO_CODE:
print('error input char')
return False
key_press(WIO_CODE[element])
time.sleep(0.1)
return True
这样,基本的问题就都解决啦
网友评论