-
WSOLA的应用背景
因特网从一个基于数据业务的网络转变为向用户提供视频,音频等多种业务的综合性的网络,互联网协议电话作为一种基于IP的实时语音传输技术,成为了目前研究的热点。当VoIP的丢包率超过了5%之后,会对语音通信质量产生比较明显的影响,需要在接收端通过一系列的丢包恢复技术来抵消无线网络大量丢包对语音通信质量造成的影响。
VoIP,Voice over Internet Protocol,意思是用IP分组网络进行话音传输
WSOLA,Waveform Similarity OverLap and Add,波形相似叠加
波形相似叠加WSOLA算法是一种常用的丢包恢复技术,其利用了人耳的掩蔽效应以及人类语音信号的短时相关性。
-
VoIP与PSTN的区别
VoIP优势:传统的公共交换电话网是建造在由设备厂商提供应用的基础架构上的,另外数据语音视频无法三者合一,为语音而建的架构很难足够灵活的承载数据。
VoIP劣势:致命弱点是语音质量,影响语音质量问题包括丢包,延迟和抖动。为了改进质量,归纳为三类,注册许可控制策略,资源预留策略(RSVP),自适应策略。
-
数字语音信号
由于人类语音属于一种模拟信号,脉冲编码调制PCM是一种常用的把模拟语音信号数字化的方法。
模拟波形通过一个音频过滤器,将输入信号中所有超过4kHZ的部分过滤
对过滤后的模拟信号进行8k samples/s,波形被采样后转换成离散的数字表达方式
-
时间尺度修改技术
在保证语音基音频率不变的前提下,对一段语音的时域尺度进行修改,已达到在不明显降低语音质量的同时延长或缩短语音持续时间的目的。
1.jpg
最常用的时域尺度修改技术主要有基音同步叠加法(Pitch Synchronous OverLap and Add, PSOLA)和波形相似叠加法。(Waveform Similarity OverLap and Add)
网友评论