美文网首页
selenium反屏蔽

selenium反屏蔽

作者: 盗花 | 来源:发表于2020-04-02 22:12 被阅读0次

现在很多网站都加上了对Selenium的检测,来防止一些爬虫的恶意爬取。即如果检测到有人在使用Selenium打开浏览器,那就直接屏蔽。其大多数情况下,检测基本原理是检测当前浏览器窗口下的window.navigator对象是否包含webdriver这个属性。因为在正常使用浏览器的情况下,这个属性是undefined,然而一旦我们使用了Selenium,Selenium会给window.navigator设置webdriver属性。很多网站就通过 JavaScript 判断如果 webdriver 属性存在,那就直接屏蔽。

解决办法是使用CDP,在每个页面刚加载的时候执行script代码,使得navigator的webdriver属性为undefined。示例代码如下:

from selenium import webdriver

browser = webdriver.Chrome()
browser.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {
    'source': 'Object.defineProperty(navigator, "webdriver", {get: () => undefined})'
})
browser.get('https://someurl')

相关文章

  • selenium反屏蔽

    现在很多网站都加上了对Selenium的检测,来防止一些爬虫的恶意爬取。即如果检测到有人在使用Selenium打开...

  • 抓取智联招聘

    网页屏蔽,服务器屏蔽 模拟用户进行数据抓取 基于selenium库和selenium.webdriver 抓取数据...

  • Selenium:反爬

    1. 反爬 有时候,我们利用 Selenium 自动化爬取某些网站时,极有可能会遭遇反爬。 实际上,我们使用默认的...

  • 淘宝密码加密方式分析,及python实现

    上回说到《分析淘宝登陆对selenium爬虫的封杀方案,反爬虫机制的升级》、《淘宝封杀selenium的ua算法分...

  • 利用selenium cookies实现淘宝免密登录

    关键词:selenium,python,淘宝,反爬虫,cookies 一、阿里这种公司“反爬虫技术”业界一流,如下...

  • 最简单的selenium+Python自动右键保存图片

    最近需要爬古籍影印版图片,但是对方网站有反爬虫,于是考虑用selenium,selenium比想象中的简单。右键的...

  • 爬虫一些方法

    我们先来说一下selenium语法 selenium这个语法呢就是模拟用户点击可以有效率的防止反爬下面我们来介绍一...

  • 屏蔽网站对selenium的检测

    使用mitmproy可以屏蔽对selenium的检测 在爬取淘宝拉取验证码的时候,可以使用mitmproxy中的f...

  • 爬虫遭遇StackPath反爬的应对之策

    遇到StackPath反爬时出现图下提示: 处理方式很简单,通过selenium获取cookie即可。 此处目标:...

  • selenium防止反爬机制

    问题:打开网页不能正常加载,服务器拒绝访问 第一部分隐藏 window.navigator.webdriver (...

网友评论

      本文标题:selenium反屏蔽

      本文链接:https://www.haomeiwen.com/subject/rkxqphtx.html