正式上手,本文章吸取了一些其他简友的思想。
本次内容:很多网络小说都始发于起点中文网,大部分小说特别是一些比较火的小说看的时候都需要付费。既然有收费,那就一定有盗版免费的小说出现,而有些网站(盗版小说)只能在线观看,不能下载,本次内容就是将只能观看不能下载的小说爬下来。
下面列出本次爬取得网站以及书的内容。
小说网站-笔趣看:URL:http://www.biqukan.com/
笔趣看是一个盗版小说网站,这里有很多起点中文网的小说,该网站小说的更新速度稍滞后于起点中文网正版小说的更新速度。并且该网站只支持在线浏览,不支持小说打包下载。因此,本次实战就是从该网站爬取并保存一本名为《一念永恒》的小说,该小说是耳根正在连载中的一部玄幻小说。PS:本实例仅为交流学习,支持耳根大大,请上起点中文网订阅。
下面是本次爬取得代码:
from bs4 import BeautifulSoup
import requests
if __name__ == '__main__':
target = 'https://www.biqukan.com/1_1094/5403177.html'
req = requests.get(url=target)
html = req.text
bf = BeautifulSoup(html)
texts = bf.find_all('div',class_='showtxt')
print(texts)
ps:本次爬起貌似没有成功。立个flag,下周之内,一定爬取成功,并更改此次代码。
网友评论