python 爬取起点小说vip章节（失败）

python 爬取起点小说vip章节（失败）

作者: 青铜搬砖工 | 来源:发表于2018-04-23 14:05 被阅读0次

python 爬取起点小说vip章节（失败）
python多线程爬虫爬取顶点小说内容（BeautifulSou
BeautifulSoup4小试牛刀
py爬虫遇见的问题。
2017-12-31
实战爬取起点中文网全部作品信息（基于lxml）
python 爬虫练习（一）
爬取小说网站章节和小说语音播放（文章末-->获取源码）
利用Python实现在线免费观看各大网站VIP电影（送源码）
【上干货啦】利用Python实现在线免费观看各大网站VIP电影

今天心血来潮，想爬取起点vip小说章节，花费了足足0.27大洋后，悟出来一个人生道理，这个应该是爬不下来。但是这0.27大洋也教会了我两个知识点。

1.服务器只会响应客户端的请求，不会主动给客户端发送信息

例如我爬取的这一章vip章节

image.png

客户端就会一直向服务器发送checkStatus?_csrfToken=w7RePr18qXzxByPdIn0h7iQtII0AC4z8oPMIXioz的请求，如果我没有付钱，服务器就会返回

image.png
如果我付钱了
就会返回

{"code":0,"data":{"readUrl":"//vipreader.qidian.com/chapter/3242304/67958436"},"msg":"suc"}

接收到这个返回后客户端会在发送一个请求章节内容的request（是不是我冒充服务器给浏览器发一个{"code":0,"data":{"readUrl":"//vipreader.qidian.com/chapter/3242304/67958436"},"msg":"suc"}的response，浏览器就会发一个请求全部内容的request，是不是就可以获得全部章节内容，就可以爬取vip章节了，前提是服务器不会在验证我是否已经付钱），这时候如果验证我猜服务器会去数据库查查我这个用户有没有付钱，如果有的话就会返回全部章节信息，如果没有的话就返回试读的信息（这是不是一个反爬虫的手段？服务器再次验证是否有vip权限）。
所以目前我认为如果不修改起点数据库中我付费字段的标记，那应该是爬取不到全部vip章节信息的。

2.cookie是服务器识别用户的手段

因为我付费是在谷歌浏览器付费，所以当我输入

https://vipreader.qidian.com/ajax/chapter/chapterInfo?_csrfToken=w7RePr18qXzxByPdIn0h7iQtII0AC4z8oPMIXioz&bookId=3242304&chapterId=67743698&authorId=4362948

谷歌浏览器显示全部章节内容：

image.png

但是换一个浏览器后，输入相同的网址，则只会显示试读内容：

image.png

相关文章

python 爬取起点小说vip章节（失败）
今天心血来潮，想爬取起点vip小说章节，花费了足足0.27大洋后，悟出来一个人生道理，这个应该是爬不下来。但是这0...
python多线程爬虫爬取顶点小说内容（BeautifulSou
思路之前写过python爬取起点中文网小说，多线程则是先把爬取的章节链接存到一个列表里，然后写一个函数get_t...
BeautifulSoup4小试牛刀
python真好玩，python真有趣，python真该死！尝试爬取起点中文网的小说，因为他家的小说网页比较复杂，...
py爬虫遇见的问题。
爬虫的大神们，图片是一个小说网站。每个章节的全部内容需要登录并且充值成为vip才可以观看，怎么来爬取收费的小说，请...
2017-12-31
python爬虫实战：爬取全站小说排行榜 ...
实战爬取起点中文网全部作品信息（基于lxml）
目标爬取起点中文网全部作品前100页的信息，需要爬取的有小说名（title）、作者ID（author）、小说类型...
python 爬虫练习（一）
通过python 爬虫爬取小说使用python版本为3.6 模块为 Requests,BeautifulSo...
爬取小说网站章节和小说语音播放（文章末-->获取源码）
爬取小说网站章节和小说语音播放（文章末-->获取源码）爬去小说网站说干就干！！现在来了,撸起袖子开始就是干!!...
利用Python实现在线免费观看各大网站VIP电影（送源码）
前言今天再给大家分享一个Python爬取VIP电影的文章，支持三网的.... 基本环境配置版本：Python3...
【上干货啦】利用Python实现在线免费观看各大网站VIP电影
前言今天再给大家分享一个Python爬取VIP电影的文章，支持三网的.... 基本环境配置版本：Python3...

网友评论

本文标题：python 爬取起点小说vip章节（失败）

本文链接：https://www.haomeiwen.com/subject/detllftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|python 爬取起点小说vip章节（失败）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！