爬取小说网站章节和小说语音播放(文章末-->获取源码)
爬去小说网站说干就干!!
现在来了,撸起袖子开始就是干!!
百度搜索一下 "小说网站" ,好第一行就你了,目标-->"起点小说"
![](https://img.haomeiwen.com/i16163152/62c0b46a27ea2d62.png)
点击进去复制改小说的网址为:起点小说("https://www.qidian.com/")
![](https://img.haomeiwen.com/i16163152/4ad6f5a20e3dff0a.png)
1,获取网站的骨架-"html"下面你的是伪造浏览器向该小说网站发送请求的面具-->hearder:{....}
下面为了让读者更好的理解我就以一个最简单你的批量图片下载来讲这个步骤吧,,源码会放在后面
![](https://img.haomeiwen.com/i16163152/82a7753d51381f35.png)
![](https://img.haomeiwen.com/i16163152/46423605649efa04.png)
然后让我们获取的html文件z整理成xml文件,,为了后面的方便定位标签属性.
![](https://img.haomeiwen.com/i16163152/1ea55cdb3d813c09.png)
有人就会问了,我整理好了怎么去获取改文件的超链接呢对吧,别慌这就讲来;
![](https://img.haomeiwen.com/i16163152/f9bae041643232c9.png)
看到网站的结构是这样的那么对应的爬取的路线就有了,
![](https://img.haomeiwen.com/i16163152/b79b735d828a432b.png)
上面形成的xml对应的属性结构去查询他的对应的节点,这样我们就很容易会爬取到对应的图片的连接对吧....
![](https://img.haomeiwen.com/i16163152/c23be3bde8dee78a.png)
![](https://img.haomeiwen.com/i16163152/5aebb130b994e791.png)
这个是上面文件爬取到的图片(一部分):
![](https://img.haomeiwen.com/i16163152/f011d838fbe42dfd.png)
把获取到的连接上面的代码会进行自动的下载,,这样就很容易会完成网站上的批量图片下载...你们也可以百度网盘下载:
起点的小说源代码附加
![](https://img.haomeiwen.com/i16163152/5ed2922c27a395eb.png)
![](https://img.haomeiwen.com/i16163152/e191c1a3076faf72.png)
![](https://img.haomeiwen.com/i16163152/77f3b6527d1b7e76.png)
扫码公众号回复“爬取小说网站”、“语音播报”获取源码
![](https://img.haomeiwen.com/i16163152/d3b4af2afe26d7dd.jpg)
网友评论