美文网首页
HtmlUnit爬虫

HtmlUnit爬虫

作者: 三两五 | 来源:发表于2016-05-04 13:37 被阅读90次

    首先来看一下实例

    WebClient client=new WebClient(BrowserVersion.CHROME);

    初始化client,可以设置不同浏览器版本的client.

    HtmlPage page=client.getPage("http://www.baidu.com/");

    /**设置不需要javascript支持*/

    client.getOptions().setJavaScriptEnabled(false);

    /**设置不需要css支持*/

    client.getOptions().setCssEnabled(false);

    /**获取form*/

    HtmlForm form=page.getFormByName("f");

    //HtmlTextInput text= form.getInputByName("wd");

    HtmlInputhtmlInput= (HtmlInput)page.getHtmlElementById("kw");

    htmlinput  比 htmltextinput要好,

    System.out.println(htmlInput.toString());

    htmlInput.setValueAttribute("雅蠛蝶");

    System.out.println("input value attribute==>"+htmlInput.toString());

    HtmlInputbtn= (HtmlInput)page.getHtmlElementById("su");

    HtmlPagepage2=btn.click();

    System.out.println(page2.asXml());

    相关文章

      网友评论

          本文标题:HtmlUnit爬虫

          本文链接:https://www.haomeiwen.com/subject/msvrrttx.html