起因
为什么想到写这么一篇文章呢?
- 早上在逛runnersworld网站的时候,发现很多不错的健身方面的视频,于是想下载下来,后期可以进行剪辑发布到短视频上供大家参考学习。于是,不容想太多,直接开干。
尝试
- 首先想到的是检查页面元素,看能否直接找到视频链接,结果这种方法行不通
- 紧接着想到了抓包,于是安装了Charles(我电脑是mac电脑,配置方式大家可以自行Bai度)
-
安装配置完毕,开始抓包,抓下来的包类似下面这种样式,很明显,视频作者将视频进行了分割
抓包图 - 通过网上查询发现了这种格式 m3u8 是一种苹果公司制定的标准。上图中的.m3u8文件就是视频小段ts文件的索引文件,下面要下载视频用的就是这个索引文件。
准备
- 刚开始想到的是将这些ts小文件批量下载下来,然后再合成MP4文件,我也这样做了。
我写了一个程序,用于下载这些ts文件,源码如下:
import requests
import threading
import datetime
count =0;
def Handler(start, end, url, filename):
for i in filename[start:end]:
global count
r = requests.get("https://hdm-streaming-otfp.hearst.io/5d8572b8-320b-4cba-a54b-bc16eca15e8f/"+i.replace("\n",""),stream=True)
with open("ts/"+i.replace("\n",""), "wb") as f:
f.write(r.content)
count =count+1
print("下载进度:%.2f" % (count/len(filename)))
def download_file(url, num_thread = 10):
f = open('index.m3u8', 'r', encoding='utf-8')
text_list = f.readlines()
s_list = []
for i in text_list:
if i.find('#EX')==-1:
s_list.append(i)
f.close()
file_size = len(s_list)
print(s_list)
# 启动多线程写文件
part = file_size // num_thread # 如果不能整除,最后一块应该多几个字节
for i in range(num_thread):
start = part * i
if i == num_thread - 1: # 最后一块
end = file_size
else:
end = start + part
t = threading.Thread(target=Handler, kwargs={'start': start, 'end': end, 'url': url, 'filename': s_list})
t.setDaemon(True)
t.start()
# 等待所有线程下载完成
main_thread = threading.current_thread()
for t in threading.enumerate():
if t is main_thread:
continue
t.join()
#print('%s 下载完成' % file_name)
if __name__ == '__main__':
url ="https://hdm-streaming-otfp.hearst.io/5d8572b8-320b-4cba-a54b-bc16eca15e8f/";
start = datetime.datetime.now().replace(microsecond=0)
download_file(url)
end = datetime.datetime.now().replace(microsecond=0)
print("用时: ", end='')
print(end-start)
文件下载完毕,如下图所示:
ts文件截图
- 接下来到了文件拼接部分,当我在网上查询文件拼接的方法时,发现了,下面的方法:
ffmpeg -i https://xxxxx/index.m3u8 -acodec copy -vcodec copy -absf aac_adtstoasc video.mp4
- 我就在想,是不是通过ffmpeg 这个库加上这个命令就能直接生成mp4文件,而不用先下载小文件,然后再合成了呢?如果是这样,那不就方便多了。下面进行验证:
- 我用命令
brew list
查看我本地有没有安装这个 ffmpeg 库,发现没有安装,那就安装吧。
执行命令brew install ffmpeg
然鹅,安装过程出现了错误:
==> Installing ffmpeg dependency: libtasn1
==> Pouring libtasn1-4.17.0.big_sur.bottle.tar.gz
Error: No such file or directory @ rb_sysopen - /Users/john/Library/Caches/Homebrew/downloads/6391a3501c95c7695e33d4a84f42a4c9b0a82f4483c916c767cdc110ee602179--libtasn1-4.17.0.big_sur.bottle.tar.gz
-
出现这个错误 我就进入目录:/Users/john/Library/Caches/Homebrew/downloads 发现里边有个文件跟这个很像 (后边名字为:libtasn1--4.17.0.big_sur.bottle.tar.gz)然后我尝试将已经下载的这个文件的名字改为6391a3501c95c7695e33d4a84f42a4c9b0a82f4483c916c767cdc110ee602179--libtasn1-4.17.0.big_sur.bottle.tar.gz 重新执行命令,这个库找不到的问题通过了,接下来又出现另外的库找不到,同样的思路走一遍发现也是有一个文件多了一个
-
,改名,通过。继续。为什么会出现这个问题,咱也是一脸的懵逼,或许是算哈希值得时候出错了吧,这里咱也研究不了,就先手动改吧。
安装完成,让咱们来看看 输入 ffmpeg 没有报错,太开心了,接下来实战一下试试 -
执行命令 :
ffmpeg -i https://hdm-streaming-otfp.hearst.io/5d8572b8-320b-4cba-a54b-bc16eca15e8f/video_rover_16x9_240p_sd_1642001076_1983.m3u8 -acodec copy -vcodec copy -absf aac_adtstoasc video.mp4
哈哈,顺利执行,并且video.mp4也已经下载完成。太棒了!
网友评论