基于Python Hyper实现Http2的multipart/

作者: EddyLiu2017 | 来源:发表于2017-07-25 16:05 被阅读354次

基于Python Hyper实现Http2的multipart/
基于servlet3.1异步上下文与HTTP2实现SSE
iOS 开发之实现multipart/form-data表单格式
用requests发送multipart/form-data请求
GRPC
《基于Python实现的微信好友数据分析》分享下载
[Nginx]05 - 搭建http2.0协议的服务
新词发现
RPC原理解析
werkzeug源码分析——从官网的示例代码开始

Http/2虽然推出已经不短了，但目前整体的使用率并不高，对应的支持库也并不理想，目前主要的支持库可以参考:https://github.com/http2/http2-spec/wiki/Implementations

针对也Python，目前可选的库好像只有Hyper（http://hyper.readthedocs.io/en/latest/）。Hyper在官网当中声称对Requests有很好的支持，可以将Hyper集成到Request中，完成Requests对Http/2的支持，

requests集成hyper

但在实际开发中并不理想。比如，默认Request的请求超时时间是无限的，但通过集成Hyper来使用Requests进行get请求时，还是会出现超时的情况，所以，对于Http/2的开发，不建议使用这种方式。

开发背景

在开发“才权的AI小助手”过程中，进行了DuerOS云端接口的接入，DuerOS的云端接口是基于Http/2的，而且，需要使用multipart/form-data进行当前状态和语音数据流的上传。

DuerOS语音状态和数据上传格式

http://open.duer.baidu.com/doc/dueros-conversational-service/device-interface/voice-input_markdown

面临问题和解决方案

Hyper中并没有专门的接口用来实现multipart/form-data类型数据的上传，而是直接接收已经序列化后的body数据。

Hyper数据上传

针对这种情况，我们可以Http协议的报文定义，来定制body的内容，最终实现Hyper对multipart/form-data类型数据上传的支持。

数据报文格式

示例代码

对于DuerOS的语音请求，需要讲语音状态（Json串）和语音数据（PCM音频流）以multipart/form-data的形式进行上传。这里我们通过get_multipart_formed_data（）方法来定制body内容，

'''
    msg_id：消息ID（messageId字段）
    dialog_req_id：对话ID（dialogRequestId字段）
    format：语音数据格式（format字段）
    data：语音raw data（pcm数据流）
'''
def get_multipart_formed_data(self, msg_id, dialog_req_id, format, data):
    
    event={'clientContext':['ai.dueros.device_interface.alerts.AlertsState','ai.dueros.device_interface.audio_player.PlaybackState','ai.dueros.device_interface.speaker_controller.VolumeState','ai.dueros.device_interface.voice_output.SpeechState'], \
   'event':{'header':{'namespace':'ai.dueros.device_interface.voice_input', \
                      'name':'ListenStarted', \
                      'messageId':msg_id, \
                      'dialogRequestId':dialog_req_id}, \
            'payload':{'format':format}}}
    
    event=json.dumps(event)
    
    post_data1=[]
    
    # ListenStarted事件
    post_data1.append('--'+boundary)
    post_data1.append('Content-Disposition: form-data; name="metadata"')
    post_data1.append('Content-Type: text/plain; charset=utf-8')
    post_data1.append('')
    post_data1.append(event)
#     post_data1.append('--'+boundary+'--')# test
    post_data1.append('')
    
#     return crlf.join(post_data1).encode('utf-8')# test
    
#     # Audio data
    post_data1.append('--'+boundary)
    post_data1.append('Content-Disposition: form-data; name="audio"')
    post_data1.append('Content-Type: application/octet-stream')
    post_data1.append('')
     
    body1=crlf.join(post_data1).encode('utf-8')
     
    body2=data
     
    post_data3=[]
    post_data3.append('--'+boundary+'--')
    post_data3.append('')
    body3=crlf.join(post_data3).encode('utf-8')
     
    upload_data=body1+b'{0}'.format(crlf)+body2+b'{0}'.format(crlf)+body3
     
    return upload_data

语音状态和数据上传，

'''
    msg_id：消息ID（messageId字段）
    dialog_req_id：对话ID（dialogRequestId字段）
    format：语音数据格式（format字段）
    data：语音raw data（pcm数据流）
'''
def voice_raw_data_upload(self, msg_id, dialog_req_id, format, data):
    post_body=self.get_multipart_formed_data(msg_id, dialog_req_id, format, data)
    self.conn.request('POST', path_upload_voice_data, headers=self.headers, body=post_body)
    resp = self.conn.get_response()
      
    return resp.read()