Python爬虫入门

作者: 只有三挡的风扇 | 来源:发表于2019-02-17 20:19 被阅读4次

    正式上手,本文章吸取了一些其他简友的思想。
    本次内容:很多网络小说都始发于起点中文网,大部分小说特别是一些比较火的小说看的时候都需要付费。既然有收费,那就一定有盗版免费的小说出现,而有些网站(盗版小说)只能在线观看,不能下载,本次内容就是将只能观看不能下载的小说爬下来。

    下面列出本次爬取得网站以及书的内容。
    小说网站-笔趣看:URL:http://www.biqukan.com/

    笔趣看是一个盗版小说网站,这里有很多起点中文网的小说,该网站小说的更新速度稍滞后于起点中文网正版小说的更新速度。并且该网站只支持在线浏览,不支持小说打包下载。因此,本次实战就是从该网站爬取并保存一本名为《一念永恒》的小说,该小说是耳根正在连载中的一部玄幻小说。PS:本实例仅为交流学习,支持耳根大大,请上起点中文网订阅。

    下面是本次爬取得代码:

    from bs4 import BeautifulSoup
    import requests
    
    
    if __name__ == '__main__':
        target = 'https://www.biqukan.com/1_1094/5403177.html'
        req = requests.get(url=target)
        html = req.text
        bf = BeautifulSoup(html)
        texts = bf.find_all('div',class_='showtxt')
        print(texts)
    

    ps:本次爬起貌似没有成功。立个flag,下周之内,一定爬取成功,并更改此次代码。

    相关文章

      网友评论

        本文标题:Python爬虫入门

        本文链接:https://www.haomeiwen.com/subject/irtneqtx.html