抖音加了加密参数
以下内容仅供学习交流之用,如有造成不良后果请自负
抖音作为月活用户近亿的 app,对部分请求的合法性验证竟然没有,而这些没有验证的接口就是可以拿到抖音全站公开数据的接口
玩过抖音的应该都知道,抖音有个分享功能。通过分享功能分享用户主页是可以拿到每个用户喜欢的视频 id、点赞数等以及用户公开数据。
抖音的用户 ID 有两种,一个是 app 内显示的 shortid, 一个是分享时显示的 userid,通过 shortid 是很难拿到数据的,但是分享功能只能拿到 shortid。这样爬虫不能增量爬取,没什么用,除非有个用户能把抖音全视频点赞
简陋的 web 网页拿不下来只能从 app 入手,抓包分析一个 app 远没有 web 简单。
抓包过程中会发现抖音有个 feed 接口,一次请求能拿到好几条数据,其实我告诉你,没用
这里有个取巧的办法,通过分享的用户主页点击某条用户点赞的视频抓 app 的包能拿到需要的数据,也就是视频 id 获取 userid
至此所有需要的数据以及接口都出来的增量爬取也就可以实现了
截至发稿时,博主单线程爬取 12w,视频下载 4w
转载请注明出处: Bankroft
网友评论