美文网首页
使用Flask爬取抖音的视频,生成api接口

使用Flask爬取抖音的视频,生成api接口

作者: Lucky_李 | 来源:发表于2022-07-19 15:13 被阅读0次

    短视频爬虫

    使用Python来爬取短视频链接,目前只分析了抖音的,用Flask生成了api接口,项目地址:ShortVideoSpider。配套客户端详见short_video_spider_client

    需要的库

    • Flask~=2.1.2
    • requests
    • pyOpenSSL

    接口

    单个视频

    • 本地地址:http://ip:port/douyin/single?url=https://v.douyin.com/2jA2dGq/&is_origin=0
    • 线上地址:http://81.68.122.109:8080/douyin/single?url=https://v.douyin.com/2jA2dGq/&is_origin=0
      参数说明:
      url:分享的短视频链接,可以直接使用复制内容,会解析里面的链接
      
      is_origin: 是否需要原始返回数据(0为需要,1为不需要)
      
      返回数据(is_origin为0):
      {
      "code": 200,
      //cover_image_url 视频封面的图片地址
      "cover_image_url": "https://p3-sign.douyinpic.com/obj/tos-cn-i-dy/b3cc0713ff7c4ad58e989ad4b8fde693?x-expires=1659412800&x-signature=SxHpFcL6X9HpvAS005QMN%2BhPh2Q%3D&from=4257465056_large",
      //video_url 视频无水印地址
      "video_url": "https://aweme.snssdk.com/aweme/v1/play/?video_id=v0200fg10000cb6l3ojc77u09nmstov0&ratio=720p&line=0"
      }
      
      返回数据(is_origin为1):
      抖音的详细数据,返回的数据太多,自己进行测试。
      
      

    多个视频

    • 本地地址:http://ip:port/douyin/list?url=https://v.douyin.com/2YVVPR7/&is_origin=0&max_cursor=0
    • 线上地址:http://81.68.122.109:8080/douyin/list?url=https://v.douyin.com/2YVVPR7/&is_origin=0&max_cursor=0
      参数说明:(一次最多返回20条数据)
      url:分享的用户主页链接,可以直接使用复制内容,会解析里面的链接
      is_origin: 是否需要原始返回数据(0为需要,1为不需要)
      max_cursor:第一次为0,返回会有hasmore来确定是否有更多数据,设置返回的max_cursor到下次的请求参数来请求下次的数据
      返回数据(is_origin为0):
      {
      "code": 200,
      //视频封面图片地址的列表
      "cover_image_url_list": [
         .....
      ],
      //描述信息
      "des": "",
      //是否有更多数据
      "has_more": true,
      //下次最大滑动距离
      "max_cursor": 1643624245000,
      //视频无水印地址列表
      "video_url_list": [
         .....
       ]
      }
      
      请求的数据太多,自己进行测试。
      

    用户信息

    • 本地地址:http://ip:port/douyin/user?url=https://v.douyin.com/2YVVPR7/
    • 线上地址:http://81.68.122.109:8080/douyin/user?url=https://v.douyin.com/2YVVPR7/
      参数说明:
      url:分享的用户主页链接,可以直接使用复制内容,会解析里面的链接
      返回数据:
      { "code": 200,
        "extra": {
         "logid": "20220715151907010209168157440162C9",
         "now": 1657869547000 },
        "status_code": 0,
        "user_info": {
         "avatar_larger": {
             "uri": "aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9",
             "url_list": [
                 "https://p3.douyinpic.com/aweme/1080x1080/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662",
                 "https://p11.douyinpic.com/aweme/1080x1080/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662",
                 "https://p26.douyinpic.com/aweme/1080x1080/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662"
             ]
         },
         "avatar_medium": {
             "uri": "aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9",
             "url_list": [
                 "https://p3.douyinpic.com/aweme/720x720/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662",
                 "https://p11.douyinpic.com/aweme/720x720/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662",
                 "https://p26.douyinpic.com/aweme/720x720/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662"
             ]
         },
         "avatar_thumb": {
             "uri": "aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9",
             "url_list": [
                 "https://p3.douyinpic.com/aweme/100x100/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662",
                 "https://p11.douyinpic.com/aweme/100x100/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662",
                 "https://p26.douyinpic.com/aweme/100x100/aweme-avatar/tos-cn-i-0813_8b7da88366bc40bba58e2f8bce0255c9.jpeg?from=2956013662"
             ]
         },
         "aweme_count": 6,
         "card_entries": [],
         "custom_verify": "",
         "enterprise_verify_reason": "",
         "favoriting_count": 0,
         "follow_status": 0,
         "follower_count": 101,
         "followers_detail": null,
         "following_count": 239,
         "geofencing": null,
         "is_gov_media_vip": false,
         "is_mix_user": false,
         "mix_count": 0,
         "mix_info": null,
         "mplatform_followers_count": 101,
         "nickname": "十七😍",
         "original_musician": {
             "digg_count": 0,
             "music_count": 0,
             "music_used_count": 0
         },
         "platform_sync_info": [],
         "policy_version": null,
         "sec_uid": "MS4wLjABAAAAsRIQ9howZwtPIsFFZhkMS6q2KIc4wLs5q7LlExJqUNA",
         "secret": 0,
         "short_id": "0",
         "show_favorite_list": false,
         "signature": "互关咯\n#中二病 #熬夜冠军 #俄语废物",
         "total_favorited": "263",
         "type_label": null,
         "uid": "405060254438335",
         "unique_id": "xsy897256134",
         "verification_type": 0
        }}    
      

    免责声明

    本仓库只为学习研究,如涉及侵犯个人或者团体利益,请与我取得联系,我将主动删除一切相关资料,谢谢!

    相关文章

      网友评论

          本文标题:使用Flask爬取抖音的视频,生成api接口

          本文链接:https://www.haomeiwen.com/subject/votsirtx.html