WebDriver+Selenium实现浏览器自动化

作者: QiShare | 来源:发表于2022-08-29 10:34 被阅读0次

WebDriver+Selenium实现浏览器自动化
功能强大的python包（十）：selenium（浏览器机器人）
1.python selenium - web自动化环境搭建
【UiPath Studio 中文文档】63 图形和文本自动化
桌面自动化实现原理-RPA+
fastlane实现自动化打包
selenium工作原理及浏览器基本操作1（元素定位、各类弹框）
Web Scraper官方文档中文版（第3部分）
Web Scraper 入门教程（第6课）
Web Scraper 入门教程（第1课）

前言

Selenium是一款可以自动化操作浏览器的开源项目，最初的目的是浏览器功能的自动化测试，但是随着项目的发展，人们根据它的特性也用来做一些更多的有意思的功能而不仅仅是UI的自动化测试工具。就像Selenium官方网站上描述的那样，Selenium可以自动化操纵浏览器。完了！你想用它的能力做什么事情完全取决于你。

使用场景

针对浏览器的自动化测试有三个场景：

Selenium WebDriver：如果您想创建健壮的、基于浏览器的回归自动化套件和测试、在许多环境中扩展和分发脚本，那么您需要使用 Selenium WebDriver，它是一组特定于语言的绑定来驱动浏览器——这就是它的本意驱动的
Selenium IDE：如果您想创建快速的错误重现脚本，创建脚本以帮助自动化辅助探索性测试，那么您想使用 Selenium IDE； Chrome、Firefox 和 Edge 插件，可以对与浏览器的交互进行简单的记录和回放
Selenium Grid：如果您想通过在多台机器上分发和运行测试来扩展并从一个中心点管理多个环境，从而可以轻松地针对大量浏览器/操作系统组合运行测试，那么您需要使用 Selenium Grid

原理

早期的Selenium目的是实现web应用的UI自动化测试，实现方式是通过三方的服务器注入js达到控制浏览器行为的目的，核心的组件叫Selenium-RC（Remote Control）
包含两个部分：

客户端侧的编写控制浏览器逻辑的库
实现控制浏览器启动和关闭的服务器

架构如下

image.png

这种架构被证明是复杂的，而且有诸多限制，比如：

复杂的架构
执行测试脚本非常耗时，因为 Selenium RC 使用 JavaScript 命令作为浏览器的指令。这会导致性能下降
API不太面向对象
不支持 Headless HTMLUnit 浏览器（不可见的浏览器）

Selenium RC 的局限性导致了新的自动化框架 Selenium WebDriver 的开发。在 2006 年引入 WebDriver 后，RC 中出现的复杂问题可以得到解决和解决
Selenium 结合WebDriver简化了浏览器的控制行为，将中间环节的服务器去掉，直接在系统层级本地化控制浏览器，优化后的架构如下：

image.png

环境准备

如果你不想在编码层实现你的功能，可以下载Selenium IDE插件，支持录制回放，过程脚本导出。

image.png

如果需要通过代码实现更多灵活自定义功能，建议使用python，环境准备
python3、pip3

brew install python3

selenium

pip3 install selenium

install browser drivers
设置您的系统以允许浏览器自动化。
通过 WebDriver，Selenium 支持市场上所有主流浏览器，例如 Chrome/Chromium、Firefox、Internet Explorer、Edge、Opera 和 Safari。在可能的情况下，WebDriver 使用浏览器的内置自动化支持来驱动浏览器

image.png

开发

First Script

通过webdriver实现控制浏览器自动访问功能


def test_eight_components():
    driver = webdriver.Chrome()
    
    driver.get("https://google.com")
    
    title = driver.title
    assert title == "Google"
    
    driver.implicitly_wait(0.5)
    
    search_box = driver.find_element(by=By.NAME, value="q")
    search_button = driver.find_element(by=By.NAME, value="btnK")
    
    search_box.send_keys("Selenium")
    search_button.click()
    
    search_box = driver.find_element(by=By.NAME, value="q")
    value = search_box.get_attribute("value")
    assert value == "Selenium"
    
    driver.quit()

WebDriver API

webDriver操纵浏览器的API大致可以分为两个部分，控制浏览器行为的比如，打开、关闭、前进、后退、刷新等和控制页面元素的如，点击、输入、获取元素内容等

浏览器

获取浏览器信息

// title
driver.getTitle(); 
// url
driver.getCurrentUrl();

导航

//打开
driver.get("https://selenium.dev");

//跳转
driver.navigate().to("https://selenium.dev");

// 后退
driver.navigate().back();

// 前进
driver.navigate().forward();

// 刷新
driver.navigate().refresh();

弹框

//根据条件找到页面中的弹框并点击
driver.findElement(By.linkText("See an example alert")).click();

//等待弹框展示并保存到变量中
Alert alert = wait.until(ExpectedConditions.alertIsPresent());

//获得弹框内容文本
String text = alert.getText();

//点击确定按钮
alert.accept();

Alert、Confirm、Prompt功能类似
Cookies
可以支持cookies的添加删除操作

import org.openqa.selenium.*;
import org.openqa.selenium.chrome.ChromeDriver;

public class addCookie {
    public static void main(String[] args) {
        WebDriver driver = new ChromeDriver();
        try {
            driver.get("http://www.example.com");

            // Adds the cookie into current browser context
            driver.manage().addCookie(new Cookie("key", "value"));
        } finally {
            driver.quit();
        }
    }
}

Frames
支持针对Frames内元素的获取及操作
Windows
WebDriver 不区分窗口和选项卡。如果您的站点打开一个新选项卡或窗口，Selenium 将允许您使用窗口句柄来处理它。每个窗口都有一个唯一标识符，该标识符在单个会话中保持不变。您可以使用以下方法获取当前窗口的窗口句柄：

driver.getWindowHandle();

元素

识别和使用DOM中的元素
大多数人的 Selenium 代码大部分都涉及使用 Web 元素。这部分功能和写前端代码的document.getElementById作用差不多，思想比较简单，就是找到页面中的元素然后执行模拟用户行为的操作
支持绝对定位和相对定位的策略，针对复杂页面ID，Tag，Class不好定位的情况可以使用xPath方式，非常灵活，其实也不用死记硬背，当某元素不好定位时，可以去官网查API的方式去实现
相对定位

image.png


def relative():
    # Above
    email_locator = locate_with(By.TAG_NAME, "input").above({By.ID: "password"})
    # Below
    password_locator = locate_with(By.TAG_NAME, "input").below({By.ID: "email"})
    # Left of
    cancel_locator = locate_with(By.TAG_NAME, "button").to_left_of({By.ID: "submit"})
    # Right of
    submit_locator = locate_with(By.TAG_NAME, "button").to_right_of({By.ID: "cancel"})
    # Near
    email_locator = locate_with(By.TAG_NAME, "input").near({By.ID: "lbl-email"})
    # Chaining relative locators
    submit_locator = locate_with(By.TAG_NAME, "button").below({By.ID: "email"}).to_right_of({By.ID: "cancel"})

传统定位

<ol id="vegetables" style="margin-top: 20px">
      <li class="potatoes">potatoes</li>
      <li class="onions">onions</li>
      <li class="tomatoes"><span>Tomato is a Vegetable</span></li>
    </ol>
    <ul id="fruits">
      <li class="bananas"></li>
      <li class="apples"></li>
      <li class="tomatoes"><span>Tomato is a Fruit</span></li>
     </ul>


def finders():
    # Evaluating entire DOM
    vegetable = driver.find_element(By.CLASS_NAME, "tomatoes")
    print(vegetable)
    # Evaluating a subset of the DOM
    fruits = driver.find_element(By.ID, "fruits")
    fruit = fruits.find_elements(By.CLASS_NAME, "tomatoes")
    print(fruit)
    # Optimized locator
    fruit = driver.find_element(By.CSS_SELECTOR, "#fruits .tomatoes")
    fruit2 = driver.find_element(By.CSS_SELECTOR, "ul .tomatoes")
    print(fruit == fruit2) # True
    # All matching elements
    plants = driver.find_elements(By.TAG_NAME, "li")
    print(plants)
    # Get all the elements available with tag name 'p'
    elements = driver.find_elements(By.TAG_NAME, 'span')
    for e in elements:
        print(e.text)


def xPath():
    ol = driver.find_element(By.XPATH, "/html/body/div/div/ol[1]")
    ol2 = driver.find_element(By.XPATH, "//ol[1]")
    ol3 = driver.find_element(By.XPATH, "//ol[@id='vegetables']")
    print(ol == ol2) # True
    print(ol == ol3) # True
    onions = driver.find_element(By.XPATH, "//ol[1]/li[2]")
    print(onions.text)

交互
5种基本命令：

click（任意元素）
send keys（仅用于文本块和内容可编辑元素）
clear（同上）
submit （form 元素）
select （选择列表元素）

获取元素信息

image.png

总结

本次分享介绍了Selenium使用场景，简单原理和一些的基础用法。并列举了一个小例子。掌握以上内容，你已经可以实现基本的UI自动化测试了。另外可以做一些爬虫和自动化操纵浏览器的工具需求就需要根据个人场景化定制了，只要你有“懒”的天性，相信一定会找到挺多有意思场景使用去使用它。

参考

https://www.selenium.dev/
https://www.browserstack.com/guide/selenium-rc-tutorial

WebDriver+Selenium实现浏览器自动化
前言 Selenium是一款可以自动化操作浏览器的开源项目，最初的目的是浏览器功能的自动化测试，但是随着项目的发展...
功能强大的python包（十）：selenium（浏览器机器人）
1.selenium简介 Selenium是一个用程序操作浏览器的工具，利用它可以实现浏览器自动化、自动化测试、辅...
1.python selenium - web自动化环境搭建
web自动化：实现代码驱动浏览器进行点点点的操作。即代码与浏览器之间进行交互。但是，代码不能够直接与浏览...
【UiPath Studio 中文文档】63 图形和文本自动化
为了举例说明使用文本识别活动实现进程的自动化，我们创建了一个打开 IE 浏览器并导航到加密货币交换市场平台的自动化...
桌面自动化实现原理-RPA+
RPA产品实现自动化从类型上大致可以分为桌面应用/浏览器应用/其它（Mainframe/Java等），本文将分析R...
fastlane实现自动化打包
fastlane实现自动化打包 fastlane实现自动化打包
selenium工作原理及浏览器基本操作1（元素定位、各类弹框）
Selenium是一款浏览器自动化框架，Webdriver是其核心，同过Webdriver将自动化脚本转化为浏览器...
Web Scraper官方文档中文版（第3部分）
WebScraper是谷歌 Chrome 浏览器插件，可自动化提取网页数据，实现不敲代码，指哪爬哪的目标，属于居家...
Web Scraper 入门教程（第6课）
WebScraper是谷歌 Chrome 浏览器插件，可自动化提取网页数据，实现不敲代码，指哪爬哪的目标，属于居家...
Web Scraper 入门教程（第1课）
WebScraper是谷歌 Chrome 浏览器插件，可自动化提取网页数据，实现不敲代码，指哪爬哪的目标，属于居家...