通过m3u8文件下载合并ts视频文件案例

作者: 强某某 | 来源:发表于2021-04-19 14:12 被阅读0次

ffmpeg 常用命令
通过m3u8文件下载合并ts视频文件案例
只需三步即可下载VIP收费视频（解决.m3u8文件中的.ts视频
加密ts文件解密
记录一次逆向分析解密某课堂加密视频
iOS 壁纸类项目核心总结
M3U8-TS文件合并为MP4文件
多个ts合并转格式mp4
FFmpeg 将.m3u8转换成.mp4实现下载网页上的视频
全网视频下载

常规网站视频存储方式

<video></video>

这样播放是不行的，因为每次播放都是整体视频下载下来，10G就下载10G，慢而且消耗带宽

一般视频网站怎么做的？

用户上传->转码(把视频处理，2K，1080，标清)->切片处理(把单个的文件进行拆分)

用户再进行拉动进度条的时候，切片用处就很大了

需要一个文件记录：1. 视频播放顺序 2. 视频存放的路径

一般默认规则这个文件就是M3U8文件

1.png

一般只需要关注EXT-X-KEY：这个有没有，有的话代表加密，后面URI对应一个网络请求，一般是根路径+URI；就是获取加密key的；而METHOD就是加密方式，读取下载好的文件然后反正解密生成新ts文件即可

简单案例

91看剧：https://www.91kanju.com/vod-play/54812-1-1.html

发现源代码里面有一个url:https://m3api.awenhao.com/index.php?note=kkRspdy38c2wfrab6qgj1&raw=1&n.m3u8
此处url不是m3u8的下载路径，而是拿着note=kkRspdy38c2wfrab6qgj1去重新走ajax然后获取m3u8文件；
而且这个note很可能有时间限制，这也是为什么有些网站第一次加载缓慢时候也会导致视频播放失败，刷新一次就好了的原因

# 先下载下来m3u8文件
import requests
import re
url = 'https://www.91kanju.com/vod-play/54812-1-1.html'
headers={
    "User-Sgent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36"
}
resp = requests.get(url,headers=headers)
obj = re.compile(r"url: '(?P<url>.*?)',", re.S)
m3u8_url = obj.search(resp.text).group("url")
# print(m3u8_url) # https://m3api.awenhao.com/index.php?note=kkRs78j2wkgb1efm3ndzq&raw=1&n.m3u8
resp.close()


# 下载m3u8文件
resp2=requests.get(m3u8_url,headers=headers)
with open("哲仁王后.m3u8",mode="wb") as f:
    f.write(resp2.content)
resp2.close()

# 然后下载ts，最后此处使用quicktime这个软件是手动合并视频
# 一般ts文件都是不可以被播放的
# 此处之所以可以直接播放，是因为m3u8文件说明了是不加密的，所以可以直接合并，否则还要解密
import requests
n=1
with open("哲仁王后.m3u8",mode="r",encoding='utf-8') as f:
    for line in f:
        line=line.strip()  #去掉空白换行等
        if line.startswith('#'): #过滤#开头
            continue
        # print(line)

        # 下载视频片段
        resp=requests.get(line)
        f=open(f"video/{n}.ts",mode="wb")
        f.write(resp.content)
        resp.close()
        n+=1

# quicktime去手动合并ts文件

思路:

拿到主页面的页面源代码, 找到iframe
从iframe的页面源代码中拿到m3u8文件的地址
下载第一层m3u8文件 -> 下载第二层m3u8文件(视频存放路径)
下载视频
下载秘钥, 进行解密操作
合并所有ts文件为一个mp4文件

import requests
from bs4 import BeautifulSoup
import re
import asyncio
import aiohttp
import aiofiles
from Crypto.Cipher import AES  # pycryptodome
import os


def get_iframe_src(url):
    resp = requests.get(url)
    main_page = BeautifulSoup(resp.text, "html.parser")
    src = main_page.find("iframe").get("src")
    return src
    # return "https://boba.52kuyun.com/share/xfPs9NPHvYGhNzFp"  # 为了测试


def get_first_m3u8_url(url):
    resp = requests.get(url)
    # print(resp.text)
    obj = re.compile(r'var main = "(?P<m3u8_url>.*?)"', re.S)
    m3u8_url = obj.search(resp.text).group("m3u8_url")
    # print(m3u8_url)
    return m3u8_url


def download_m3u8_file(url, name):
    resp = requests.get(url)
    with open(name, mode="wb") as f:
        f.write(resp.content)


async def download_ts(url, name, session):
    async with session.get(url) as resp:
        async with aiofiles.open(f"video2/{name}", mode="wb") as f:
            await f.write(await resp.content.read())  # 把下载到的内容写入到文件中
    print(f"{name}下载完毕")


async def aio_download(up_url):  # https://boba.52kuyun.com/20170906/Moh2l9zV/hls/
    tasks = []
    async with aiohttp.ClientSession() as session:  # 提前准备好session
        async with aiofiles.open("越狱第一季第一集_second_m3u8.txt", mode="r", encoding='utf-8') as f:
            async for line in f:
                if line.startswith("#"):
                    continue
                # line就是xxxxx.ts
                line = line.strip()  # 去掉没用的空格和换行
                # 拼接真正的ts路径
                ts_url = up_url + line
                task = asyncio.create_task(download_ts(ts_url, line, session))  # 创建任务
                tasks.append(task)

            await asyncio.wait(tasks)  # 等待任务结束


def get_key(url):
    resp = requests.get(url)
    return resp.text

# 解密
async def dec_ts(name, key):
  # 此处IV=b"0000000000000000"中0的个数对应key的字符串长度
    aes = AES.new(key=key, IV=b"0000000000000000", mode=AES.MODE_CBC)
    async with aiofiles.open(f"video2/{name}", mode="rb") as f1,\
        aiofiles.open(f"video2/temp_{name}", mode="wb") as f2:
        bs = await f1.read()  # 从源文件读取内容
        await f2.write(aes.decrypt(bs))  # 把解密好的内容写入文件
    print(f"{name}处理完毕")


async def aio_dec(key):
    # 解密
    tasks = []
    async with aiofiles.open("越狱第一季第一集_second_m3u8.txt", mode="r", encoding="utf-8") as f:
        async for line in f:
            if line.startswith("#"):
                continue
            line = line.strip()
            # 开始创建异步任务
            task = asyncio.create_task(dec_ts(line, key))
            tasks.append(task)
        await asyncio.wait(tasks)


def merge_ts():
    # mac: cat 1.ts 2.ts 3.ts > xxx.mp4
    # windows: copy /b 1.ts+2.ts+3.ts xxx.mp4
    lst = []
    with open("越狱第一季第一集_second_m3u8.txt", mode="r", encoding="utf-8") as f:
        for line in f:
            if line.startswith("#"):
                continue
            line = line.strip()
            lst.append(f"video2/temp_{line}")

    s = " ".join(lst)  # 1.ts 2.ts 3.ts
    os.system(f"cat {s} > movie.mp4")
    print("搞定!")


def main(url):
    # 1. 拿到主页面的页面源代码, 找到iframe对应的url
    iframe_src = get_iframe_src(url)
    # 2. 拿到第一层的m3u8文件的下载地址
    first_m3u8_url = get_first_m3u8_url(iframe_src)
    # 拿到iframe的域名
    # "https://boba.52kuyun.com/share/xfPs9NPHvYGhNzFp"
    iframe_domain = iframe_src.split("/share")[0]
    # 拼接出真正的m3u8的下载路径
    first_m3u8_url = iframe_domain+first_m3u8_url
    # https://boba.52kuyun.com/20170906/Moh2l9zV/index.m3u8?sign=548ae366a075f0f9e7c76af215aa18e1
    # print(first_m3u8_url)
    # 3.1 下载第一层m3u8文件
    download_m3u8_file(first_m3u8_url, "越狱第一季第一集_first_m3u8.txt")
    # 3.2 下载第二层m3u8文件
    with open("越狱第一季第一集_first_m3u8.txt", mode="r", encoding="utf-8") as f:
        for line in f:
            if line.startswith("#"):
                continue
            else:
                line = line.strip()  # 去掉空白或者换行符  hls/index.m3u8
                # 准备拼接第二层m3u8的下载路径
                # https://boba.52kuyun.com/20170906/Moh2l9zV/ + hls/index.m3u8
                # https://boba.52kuyun.com/20170906/Moh2l9zV/hls/index.m3u8
                # https://boba.52kuyun.com/20170906/Moh2l9zV/hls/cFN8o3436000.ts
                second_m3u8_url = first_m3u8_url.split("index.m3u8")[0] + line
                download_m3u8_file(second_m3u8_url, "越狱第一季第一集_second_m3u8.txt")
                print("m3u8文件下载完毕")

    # 4. 下载视频
    second_m3u8_url_up = second_m3u8_url.replace("index.m3u8", "")
    # 异步协程
    asyncio.run(aio_download(second_m3u8_url_up))  # 测试的使用可以注释掉

    # 5.1 拿到秘钥
    key_url = second_m3u8_url_up + "key.key"  # 偷懒写法, 正常应该去m3u8文件里去找
    key = get_key(key_url)
    # 5.2 解密
    asyncio.run(aio_dec(key))

    # 6. 合并ts文件为mp4文件
    merge_ts()


if __name__ == '__main__':
    url = "https://www.91kanju.com/vod-play/541-2-1.html"
    main(url)

ffmpeg 常用命令
1,合并加密的 ts 下载m3u8,下载 key.key,更名为 key.m3u8,下载 ts 文件,m3u8 中...
通过m3u8文件下载合并ts视频文件案例
常规网站视频存储方式这样播放是不行的，因为每次播放都是整体视频下载下来，10G就下载10G，慢而且消耗带宽一般...
只需三步即可下载VIP收费视频（解决.m3u8文件中的.ts视频
只需三步即可下载VIP收费视频（解决.m3u8文件中的.ts视频文件）2019年创作。。。说明：用于学习交流，若...
加密ts文件解密
m3u8视频另一种下载方式如上图中用ts链接直接下载下来的ts视频文件是加密的（为什么要下加密的？虽然加密但是下载...
记录一次逆向分析解密某课堂加密视频
视频是某课堂加密了的，直接抓包得到m3u8文件下载是下载不了的，直接下载m3u8内的ts文件也是播放不了的。通过下...
iOS 壁纸类项目核心总结
iOS解析M3U8文件及TS文件下载与合并iOS下编译FFmpeg的经验及各种错误收集处理# iOS开发 - 超详...
M3U8-TS文件合并为MP4文件
M3U8文件是一个索引文件，里面包好N个TS的分片文件，组成一个视频文件。目前在直播和点播中应用非常广泛。我们下载...
多个ts合并转格式mp4
用N_m3u8DL-CLI下载视频文件后，发现没有自动合并，而是多个ts文件。在文件夹下新建记事本，将下列代码复...
FFmpeg 将.m3u8转换成.mp4实现下载网页上的视频
1.获取m3u8文件 Chorme 开发者模式，network中找到m3u8的完整下载地址 2. 下载ts文件，并...
全网视频下载
史上最全的视频下载方案如何利用谷歌浏览器的开发者工具下载很多个.ts文件？批量下载ts视频文件在文件夹下，sh...