Python爬虫入门

作者: 只有三挡的风扇 | 来源:发表于2019-02-17 20:19 被阅读4次

3分钟带你了解世界第一语言Python 入门上手也这么简单！
Python网络爬虫（八） - 利用有道词典实现一个简单翻译程序
Python网络爬虫（七）- 深度爬虫CrawlSpider
Python网络爬虫（二）- urllib爬虫案例
Python网络爬虫（一）- 入门基础
Python网络爬虫（四）- XPath
Python网络爬虫（三）- 爬虫进阶
Python网络爬虫（六）- Scrapy框架
Python网络爬虫（五）- Requests和Beautifu
Python爬虫入门

正式上手，本文章吸取了一些其他简友的思想。
本次内容：很多网络小说都始发于起点中文网，大部分小说特别是一些比较火的小说看的时候都需要付费。既然有收费，那就一定有盗版免费的小说出现，而有些网站（盗版小说）只能在线观看，不能下载，本次内容就是将只能观看不能下载的小说爬下来。

下面列出本次爬取得网站以及书的内容。
小说网站-笔趣看：URL：http://www.biqukan.com/

笔趣看是一个盗版小说网站，这里有很多起点中文网的小说，该网站小说的更新速度稍滞后于起点中文网正版小说的更新速度。并且该网站只支持在线浏览，不支持小说打包下载。因此，本次实战就是从该网站爬取并保存一本名为《一念永恒》的小说，该小说是耳根正在连载中的一部玄幻小说。PS：本实例仅为交流学习，支持耳根大大，请上起点中文网订阅。

下面是本次爬取得代码：

from bs4 import BeautifulSoup
import requests


if __name__ == '__main__':
    target = 'https://www.biqukan.com/1_1094/5403177.html'
    req = requests.get(url=target)
    html = req.text
    bf = BeautifulSoup(html)
    texts = bf.find_all('div',class_='showtxt')
    print(texts)

ps:本次爬起貌似没有成功。立个flag,下周之内，一定爬取成功，并更改此次代码。