音信号时域短时分析及实现 原文链接:http://www.51jrft.com/dzxx/dzkxyjs/592.html
论文首先介绍了语音信号短时时域分析的研究背景及发展现状。接着,对语音信号短时时域分析方法中涉及的理论知识作了详细的介绍,其中,包括“短时”的概念、常用的窗函数时频特性的对比分析、几种短时分析方法的理论推导。最后,在理论分析的基础上,论文完成了对上述短时分析方法的程序设计,利用MATLAB对上述算法进行仿真实验,实现了基音周期的提取和平滑,并对实验结果进行总结分析。 _HM000099关键词:语音时域短时分析;特征参数提取;窗函数;基音周期
2.1语音信号的产生及数学模型
语言是从千百万人的言语中历史地概括总结出来的规律性的符号系统,是人们用以进行思维、交际的形式。语音是声音和意义的结合体,它是语言的外壳,信息的载体。
人的发生过程一般为,由肺部收缩送出一股气流,经气管流至喉头声门处(声带开口处),对声带产生冲击,导致声带形状发生改变,随后产生一系列脉冲串,作为声音发声的激励源[5]。激励源通过声道响应变成语音,声道对激励它的体积流加以调制,最后输出声波。激励源主要分为两类:①准周期脉冲串,②随机噪声。声道对由于发不同声音时,激励源不同,声道的形状不同,所以听到不同的语音。准周期脉冲串,用于激励声道来产生浊音;随机噪声,具有白噪声性质,用于激励声道来产生清音。当气流通过声门时,如果声带的张力刚好使声带产生张弛震荡式,则产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量,这种声带振动的频率称为基音频率,相应的周期就称为基音周期(Pitch);如果声带不振动,而声道在某处收缩,迫使气流以高速通过这一收缩部分而产生湍流就产生了清音或摩擦音;如果声道在完全闭合的情况下突然释放就产生爆破音[8]。本设计下面将会讲到如何在一段语音中区分浊音和清音,并用Matlab实现。语音产生模型如图2.1。

如图2.1语音信号产生的离散时域模型中有一个浊音/清音“开关”,用来改变声道的激励形式。激励形式一般分为浊音激励和清音激励。在发浊音时,开关向上,由于声带不断张开和关闭,将产生准周期的脉冲波;在发清音时,开关向下,由随机噪声激励声道,发出清音。图中AV和AN分别为浊音和清音的幅度控制信号。
在发浊音时,声门脉冲的波形类似于斜三角形。它的数学表达式如下:

也就是说浊音激励是一个以基因周期问周期的斜三角脉冲串。
发清音时,无论是发阻塞音或摩擦音,声道在某处收缩,迫使气流以高速通过这一收缩部分而产生湍流。所以可把清音激励视为随机白噪声。实际情况,通常使用均值为0的、方差为1的,并在时间或幅值上为白色分布的序列[4]。摘 要 I
ABSTRACT II
第1章绪论 1
1.1 引言 1
1.2课题简介 1
1.2.1课题研究背景与发展现状 1
1.2.2课题的主要内容 2
1.2.3“短时”概念 3
第2章 语音信号处理的基础知识 4
2.1语音信号的产生及数学模型 4
2.2语音信号的预处理 6
2.2.1语音信号的数字化 6
2.2.2加窗分帧处理 6
2.3常用窗函数及对比分析 7
2.3.1常用的四种窗函数 7
2.3.2窗函数的对比分析 10
第3章 语音的基本时域特征 13
3.1 短时处理介绍 13
3.2短时能量 14
3.3短时平均幅度 14
3.4 短时平均过零率 15
3.5短时自相关分析 16
3.5.1常规自相关 16
3.5.2修正自相关 17
3.6短时平均幅度差 18
第4章 编程实现与实验结果分析 20
4.1 MATLAB软件平台介绍 20
4.1.1MATLAB开发环境 20
4.1.2语音信号处理常用函数 20
4.2语音短时分析的编程实现与实验结果分析 21
4.2.1短时能量 22
4.2.2短时平均幅度 26
4.2.3短时平均过零率 29
4.2.4短时自相关分析 33
4.2.5短时平均幅度差 36
4.3基于短时能量和平均幅度差的基音周期估值 38
4.3.1具体实现 39
4.3.2仿真结果及后续处理 39
总结 42
参考文献 44
致谢 45
附录:MATLAB程序源代码 46
网友评论