Android实战，Jsoup抓取简书首页资源

Android实战，Jsoup抓取简书首页资源

作者: 大豆蛋黑 | 来源:发表于2018-01-27 00:36 被阅读0次

Android实战，Jsoup抓取简书首页资源
简书首页数据抓取的答疑
简书首页数据抓取的答疑 (2)
Java爬虫实战—利用xpath表达式抓取页面信息
使用jsoup抓取简书的内容
android利用jsoup抓取数据
Android jsoup解析html、ncx文件
react-native完整实例—妹子图片查看app
RAC实战
利用Nodejs抓取网上图片并保存至本地

百度百科：jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。

之前一直看郭霖老师的《第一行代码》，里面讲述了XML和JSON格式的解析方法，我们经常遇到HTML的网页，这时候利用Jsoup可以方便抓取网页资源。

Jsoup网站：https://jsoup.org/

Android Studio可以通过Gradle方法添加依赖库

我们以简书首页为例，https://www.jianshu.com/

按F12打开开发者工具，就可以看见网页源码

假如我们想获取如下标签的内容，我们可以在元素上右键选择检查（Chrome），快速看见对应的源码。

贴代码：

查看LogCat:

Jsoup要在子线程中进行，不然会报错，别忘了申请网络权限。

抓取到了文字，接下来我们试着获取图片地址

图片的地址正是在img src处，这里以div class="banner"为节点，修改我们的代码

Logcat

用强大的Glide来加载其中一个地址：

大功告成！

相关文章

Android实战，Jsoup抓取简书首页资源
百度百科：jsoup是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。之前一直看郭霖...
简书首页数据抓取的答疑
有几位简友留言问到简书首页数据的抓取问题，说只能抓取到20条数据，如何抓取到更多；简书首页数据分页加载是怎么样处理...
简书首页数据抓取的答疑 (2)
上一篇文章简书首页数据抓取的答疑，分析了在抓取简书首页时的问题，还有一些小的细节需要注意。一、Scrapy:...
Java爬虫实战—利用xpath表达式抓取页面信息
前言之前有写过如何利用Jsoup去爬取页面信息《Java爬虫实战——利用Jsoup爬取网页资源》，那里主要是借助...
使用jsoup抓取简书的内容
抓取的是我博客的文章标题和链接，使用map存储，直接附上代码：输出如下：
android利用jsoup抓取数据
效果图首先分析html：添加依赖将String的url解析成html 解析Html 实体类 JsoupAdp...
Android jsoup解析html、ncx文件
android studio 引用jsoup compile 'org.jsoup:jsoup:1.10.3'js...
react-native完整实例—妹子图片查看app
项目目前只支持android版本，因为使用到jsoup抓取网站数据，而ios开发本人不会。数据来源全部来自网站【h...
RAC实战
RAC实战 RAC实战 - 专题 - 简书 RAC(ReactiveCocoa)学习资源汇总~持续更新 - CSD...
利用Nodejs抓取网上图片并保存至本地
1)初步应用利用http以及fs模块抓取网络数据保存至本地 2)利用爬虫抓取简书首页的文章链接及内容以及图片保存...

网友评论

本文标题：Android实战，Jsoup抓取简书首页资源

本文链接：https://www.haomeiwen.com/subject/tysgaxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Android实战，Jsoup抓取简书首页资源|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！