美文网首页
Jsoup 网络爬虫

Jsoup 网络爬虫

作者: 波西米亚的猫 | 来源:发表于2017-02-23 13:16 被阅读0次

1. Jsoup下载地址:

http://jsoup.org/packages/jsoup-1.8.1.jar

或者Maven Central

http://central.maven.org/maven2/org/jsoup/jsoup/1.8.1/jsoup-1.8.1.jar

2.实现源码

public classRun {

public static voidmain(String[] args)throwsCommonException,IOException{

String urlStr ="https://m.XXXXx.com";

// 将获取的网页 HTML 源代码转化为 Document

// Document doc = Jsoup.parse(htmlStr);

Document doc = Jsoup.connect(urlStr).get();

//head元素中内容

Element articleEle = doc.head();

//body元素中内容

Element contentEle = doc.body();

// 标题

String titleStr = articleEle.text();

System.out.println(titleStr);

Elements images = contentEle.getElementsByTag("img");

String[] imageUrls =newString[images.size()];

for(inti =0;i < imageUrls.length;i++) {

imageUrls[i] = images.get(i).attr("src");

System.out.println(imageUrls[i]);

}

}

}

3.运行结果

相关文章

  • Jsoup 网络爬虫

    1. Jsoup下载地址: http://jsoup.org/packages/jsoup-1.8.1.jar 或...

  • Jsoup爬虫

    Jsoup的使用 (1)获取HTML jsoup提供两种网络请求,get和post,使用代码也及其简单,我们首先爬...

  • Gecco文档-首页

    Gecco是什么 Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、http...

  • Java实现的简单小爬虫

    1. 背景 本文简述用Java写个简单的爬虫,通过jsoup爬取HTML,获得HTML中的数据。 2.知识 网络爬...

  • java爬虫基础--jsoup

    java爬虫框架---jsoup 在实际的开发过程中,jsoup仅仅作为对html界面解析的工具 一、解析URL ...

  • Java爬虫实战—利用xpath表达式抓取页面信息

    前言 之前有写过如何利用Jsoup去爬取页面信息《Java爬虫实战——利用Jsoup爬取网页资源》,那里主要是借助...

  • Maven dependencies

    spring mvc(自带tomcat) tomcat aop fast json jsoup 爬虫工具 JAX-...

  • 基于Jsoup+OkHttp的网络爬虫

    网络爬虫之王者荣耀故事会 因为需要,所以创造。 ——某开源社区 喜欢玩手游的朋友们应该都玩过某讯的王者农药,鄙人作...

  • 爬虫三--Jsoup

  • 利用jsoup爬虫

    jsoup其实只是一种网页分析器,帮助java程序员进行网页元素分析,其代替了用正则表达式去匹配信息的方式,效率更...

网友评论

      本文标题:Jsoup 网络爬虫

      本文链接:https://www.haomeiwen.com/subject/krfbwttx.html