美文网首页
java+selenium 自动调用火狐浏览器读取网页信息

java+selenium 自动调用火狐浏览器读取网页信息

作者: 自由行走天涯 | 来源:发表于2022-08-18 14:44 被阅读0次

pom 文件添加一下代码

 <dependency>
            <groupId>net.sourceforge.htmlunit</groupId>
            <artifactId>htmlunit</artifactId>
            <version>2.44.0</version>
        </dependency>
        <dependency>
            <groupId>net.sourceforge.htmlunit</groupId>
            <artifactId>htmlunit-cssparser</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>net.sourceforge.htmlunit</groupId>
            <artifactId>htmlunit-core-js</artifactId>
            <version>2.44.0</version>
        </dependency>

下载 geckodriver下载地址

https://github.com/mozilla/geckodriver/releases

测试代码


import org.apache.logging.log4j.LogManager;
import org.apache.logging.log4j.Logger;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
import org.openqa.selenium.firefox.FirefoxOptions;


/**
 * javaURL 类。
 *
 * @author zjm
 * @date 2022-07-28 [zjm] 创建。
 */
public class JavaURL {
    private static final Logger log= LogManager.getLogger();
    public static void main(String[] args) throws Exception{
//        System.setProperty("webdriver.firefox.marionette","e:/tools/geckodriver.exe");
        System.setProperty("webdriver.gecko.driver", "e:/tools/geckodriver.exe");
//        WebDriver driver=new FirefoxDriver();
        FirefoxOptions options = new FirefoxOptions();

        WebDriver webDriver = new FirefoxDriver(options);
        JavaURL.testBrowser(webDriver);

//        JavaURL.crawlData();
    }


    public static void testBrowser(WebDriver driver) throws Exception
    {
        driver.get("https://www.baidu.com");
        Thread.sleep(2000);
        log.info(driver.getPageSource());
        // 浏览器退出
        driver.quit();
    }

}

相关文章

  • java+selenium 自动调用火狐浏览器读取网页信息

    pom 文件添加一下代码 下载 geckodriver下载地址 https://github.com/mozill...

  • 火狐浏览器代理设置

    Firefox,中文名通常称为“火狐”或“火狐浏览器”,是一个开源网页浏览器,使用Gecko引擎(非ie内核),支...

  • HTML5入门基础知识

    初步认识网页 1.浏览器作为网页的载体,是一个能展示网页的平台。其中主要的浏览器 火狐 、Edge、safari...

  • H5API 应用缓存(ApplicationCache)

    浏览器本身的缓存机制 浏览器会对静态文件(html csss js 图片等)进行自动缓存 下一次访问该网页,会读取...

  • polo360网页制作

    此网页可兼容火狐,谷歌IE6及以上浏览器网页代码如下: css代码如下: 效果如下:

  • 客户端 HTTP 请求

    当浏览器请求网页时,它会向 web 服务器发送大量信息,这些信息不能被直接读取,因为这些信息是作为 HTTP 请求...

  • Servlet 客户端 HTTP 请求

    当浏览器请求网页时,它会向 Web 服务器发送特定信息,这些信息不能被直接读取,因为这些信息是作为 HTTP 请求...

  • 01-认识浏览器

    一、认识浏览器 浏览器是网页显示、运行的平台,常用的浏览器有IE、火狐(Firefox)、谷歌(Chrome)、S...

  • 网页截图插件的介绍

    网页截图是基于 火狐浏览器的一种插件,我们可以利用它进行各种截图行为。利于保存我们所需要的文章。 在火狐浏览器中输...

  • HTML基础

    一、开发软件 谷歌浏览器/火狐浏览器(两个皆能查看网页源代码,区别在于谷歌里面是英文,火狐里面是中文) 记事本/H...

网友评论

      本文标题:java+selenium 自动调用火狐浏览器读取网页信息

      本文链接:https://www.haomeiwen.com/subject/kjrugrtx.html