美文网首页
Android实战,Jsoup抓取简书首页资源

Android实战,Jsoup抓取简书首页资源

作者: 大豆蛋黑 | 来源:发表于2018-01-27 00:36 被阅读0次

百度百科:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。

之前一直看郭霖老师的《第一行代码》,里面讲述了XML和JSON格式的解析方法,我们经常遇到HTML的网页,这时候利用Jsoup可以方便抓取网页资源。

Jsoup网站:https://jsoup.org/  

Android Studio可以通过Gradle方法添加依赖库

我们以简书首页为例,https://www.jianshu.com/

按F12打开开发者工具,就可以看见网页源码

假如我们想获取如下标签的内容,我们可以在元素上右键选择检查(Chrome),快速看见对应的源码。

贴代码:

查看LogCat:

Jsoup要在子线程中进行,不然会报错,别忘了申请网络权限。

抓取到了文字,接下来我们试着获取图片地址

图片的地址正是在img src处,这里以div class="banner"为节点,修改我们的代码

Logcat

用强大的Glide来加载其中一个地址:

         大功告成!

相关文章

网友评论

      本文标题:Android实战,Jsoup抓取简书首页资源

      本文链接:https://www.haomeiwen.com/subject/tysgaxtx.html