Jsoup 网络爬虫

Jsoup 网络爬虫

作者: 波西米亚的猫 | 来源:发表于2017-02-23 13:16 被阅读0次

Jsoup 网络爬虫
Jsoup爬虫
Gecco文档-首页
Java实现的简单小爬虫
java爬虫基础--jsoup
Java爬虫实战—利用xpath表达式抓取页面信息
Maven dependencies
基于Jsoup+OkHttp的网络爬虫
爬虫三--Jsoup
利用jsoup爬虫

1. Jsoup下载地址：

http://jsoup.org/packages/jsoup-1.8.1.jar

或者Maven Central

http://central.maven.org/maven2/org/jsoup/jsoup/1.8.1/jsoup-1.8.1.jar

2.实现源码

public classRun {

public static voidmain(String[] args)throwsCommonException,IOException{

String urlStr ="https://m.XXXXx.com";

// 将获取的网页 HTML 源代码转化为 Document

// Document doc = Jsoup.parse(htmlStr);

Document doc = Jsoup.connect(urlStr).get();

//head元素中内容

Element articleEle = doc.head();

//body元素中内容

Element contentEle = doc.body();

// 标题

String titleStr = articleEle.text();

System.out.println(titleStr);

Elements images = contentEle.getElementsByTag("img");

String[] imageUrls =newString[images.size()];

for(inti =0;i < imageUrls.length;i++) {

imageUrls[i] = images.get(i).attr("src");

System.out.println(imageUrls[i]);

}

}

}

3.运行结果

相关文章

Jsoup 网络爬虫
1. Jsoup下载地址： http://jsoup.org/packages/jsoup-1.8.1.jar 或...
Jsoup爬虫
Jsoup的使用（1）获取HTML jsoup提供两种网络请求，get和post，使用代码也及其简单，我们首先爬...
Gecco文档-首页
Gecco是什么 Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、http...
Java实现的简单小爬虫
1. 背景本文简述用Java写个简单的爬虫，通过jsoup爬取HTML，获得HTML中的数据。 2.知识网络爬...
java爬虫基础--jsoup
java爬虫框架---jsoup 在实际的开发过程中，jsoup仅仅作为对html界面解析的工具一、解析URL ...
Java爬虫实战—利用xpath表达式抓取页面信息
前言之前有写过如何利用Jsoup去爬取页面信息《Java爬虫实战——利用Jsoup爬取网页资源》，那里主要是借助...
Maven dependencies
spring mvc(自带tomcat) tomcat aop fast json jsoup 爬虫工具 JAX-...
基于Jsoup+OkHttp的网络爬虫
网络爬虫之王者荣耀故事会因为需要，所以创造。 ——某开源社区喜欢玩手游的朋友们应该都玩过某讯的王者农药，鄙人作...
爬虫三--Jsoup
利用jsoup爬虫
jsoup其实只是一种网页分析器，帮助java程序员进行网页元素分析，其代替了用正则表达式去匹配信息的方式，效率更...

网友评论

本文标题：Jsoup 网络爬虫

本文链接：https://www.haomeiwen.com/subject/krfbwttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Jsoup 网络爬虫|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！