Python爬取FLASH播放器中的资料

作者: 迷途老鹰 | 来源:发表于2016-07-31 22:21 被阅读5614次

    Python爬取FLASH播放器中的资料。

    一、首先了解一下AMF协议:

    AMF(Action Message Format)是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层面上传输。现在很多Flash WebGame都采用这样的消息格式。
    AMF协议是基于Http协议的.
    它的内容处理过程大致是这样:
    1.从客户端获取Http请求(Request)流.
    2.对流进行解串行化(Deserialize),得到服务器端程序能够识别的数据,并建立一个响应(Response)消息
    3.Debug开始
    4.对流进行各种处理(记录、许可、服务)得到返回值
    5.对响应流进行串行化
    6.发送Http响应给客户端

    二、Python与amf进行互通需要用到PyAMF

    1、下载pyamf
    https://pypi.python.org/pypi/PyAMF
    2、安装pyamf
    下载完成之后解压出来,打开DOS命令进入pyamf目录,
    执行下列命令,安装pyamf框架
    python setup.py install --disable-ext

    三、获取关键字节伪造访问

    首先使用charles抓包工具,抓取AMF包,得到请求/应答的AMF数据,对AMF格式的请求和响应的数据进行分析。
    解密的POST DATA如下图所示:



    构建flex.messaging.messages.RemotingMessage信息

    msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
        clometOd=None,\
        operation='playeSource',\
        destination='metaDataService',\
        timeTolive=0,\
        timestamp=0
        )
    msg.body=['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
    msg.headers['DSEndpoint']='my-amf'
    msg.headers['DSId']=str(uuid.uuid1()).upper()
    ......
    

    得到的Response如下图:


    四、具体实现代码如下:

    import urllib2
    import uuid
    import pyamf
    from pyamf import remoting
    from pyamf.flex import messaging
    
    # 构造flex.messaging.messages.RemotingMessage消息
    msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
        clometOd=None,\
        operation='playeSource',\
        destination='metaDataService',\
        timeTolive=0,\
        timestamp=0
        )
    msg.body = ['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
    msg.headers['DSEndpoint'] = 'my-amf'
    msg.headers['DSId'] = str(uuid.uuid1()).upper()
    # 按AMF协议编码
    req = remoting.Request('null', body=(msg,))
    env = remoting.Envelope(amfVersion=pyamf.AMF3)
    env.bodies = [('/1',req)]
    data = bytes(remoting.encode(env).read())
    
    # 提交请求
    url = 'http://xxxx.xx.xx/amf'
    req = urllib2.Request(url,data,headers={'Content-Type':'application/x-amf'})
    
    # 解析返回数据
    oepner = urllib2.build_opener()
    
    # 解码AMF协议返回的数据
    resp = remoting.decode(opener.open(req).read())
    print resp.bodies[0][1].body.body['xxxx']
    ......
    

    相关文章

      网友评论

        本文标题:Python爬取FLASH播放器中的资料

        本文链接:https://www.haomeiwen.com/subject/tqlxsttx.html