最近无聊在看烟云酱的锐雯录播,但是发现录播文件好像会定期删除,所以我决定自己写一个程序录播烟云酱
python环境:/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6
烟云酱在企鹅电竞直播,所以先打开企鹅电竞的直播页面获取一下直播的HTML文件信息
image.png
内容非常的多啊
我看了一下页面内容
image.png
这个标题应该跟这个直播地址有关系
command + f 搜索一下 果然有我想要的东西
image.png
ok,那么我们就开始写代码获取这个地址
def save(room):
r = requests.post('https://egame.qq.com/'+room).text
soup = BeautifulSoup(r,'lxml')
print(soup)
我先写一个方法获取一下这个东西的内容
查看一下内容,有我想要的东西
image.png
但是它居然在script里面,而且在funtion 里面的window._playerInfo里面,头有点大,但是问题不大,虽然我不会直接获取,但是我可以用正则啊
#我先获取一下一这个script的数组
list = soup.find_all('script')
for obj in list:
#通过遍历去获取只要有window_.playerinfo的就是我们要找的东西
if len(re.findall('window._playerInfo',obj.get_text())):
print(obj)
然后我们处理一下这个script里面的内容就好了
image.png我们要取的就是window._playerinfo里面的字典
所以我先通过正则获取这个字典字符串的内容
content = '{'+re.findall('= {(.*?)};',obj.get_text())[0]+'}'
contentjson = json.loads(content)
url = contentjson['urlArray'][0]['playUrl']
这样就直接取到视频流的路径了
下面我们就需要用到保存的方法,把这个文件保存到我自己的电脑上上面
download = requests.get(url,stream=True)#流文件肯定很大的,所以一定要设置成stream要不然内存就爆了
filename = room + '-' + datetime.datetime.now().__str__() + '.flv'
with open(filename, "wb") as code:
for chunk in download.iter_content(chunk_size=1024):
if chunk:
code.write(chunk)
好啦,到这里就全部好啦。下面放出全部代码
import requests
from bs4 import BeautifulSoup
import re
import json
import datetime
def save(room):
r = requests.post('https://egame.qq.com/'+room).text
soup = BeautifulSoup(r,'lxml')
list = soup.find_all('script')
url = ''
for obj in list:
if len(re.findall('window._playerInfo',obj.get_text())):
content = '{'+re.findall('= {(.*?)};',obj.get_text())[0]+'}'
contentjson = json.loads(content)
url = contentjson['urlArray'][0]['playUrl']
break
download = requests.get(url,stream=True)
filename = room + '-' + datetime.datetime.now().__str__() + '.flv'
with open(filename, "wb") as code:
for chunk in download.iter_content(chunk_size=1024):
if chunk:
code.write(chunk)
#输入房间好就好了
save('194911318')
最后还有服务器的部署和定时任务还有数据的东西等我有时间再做吧.
网友评论