美文网首页
语音的帧长、帧移与帧数

语音的帧长、帧移与帧数

作者: 刘小白DOER | 来源:发表于2022-02-15 11:49 被阅读0次

    接着前面的文章,关于语音分帧问题,在前期将语音静音删除后,需要将语音裁剪成长度相同的长度或者分帧,保证数据集的统一。长度不同的音频文件不容易建模分析,需要先分帧,切成长度相同的,另外切成一小段固定长度时,段和段之间适当重叠部分。

    经过一上午的学习实践,参考librosa文档和知乎等资料,终于搞定懂了。

    语音信号是一个非稳态的、时变的信号。但在短时间范围内可以认为语音信号是稳态的、时不变的,这个短时间一般取 10-30ms。进行语音信号处理时,为减少语音信号整体的非稳态、时变的影响,从而对语音信号进行分段处理,其中每一段称为一帧,帧长一般取 25ms。为了使帧与帧之间平滑过渡,保持其连续性,分帧一般采用交叠分段的方法,保证相邻两帧相互重叠一部分,末尾不足部分用零填充。相邻两帧的起始位置的时间差称为帧移,我们一般在使用中帧移取值为 10ms。

    那么对于一个 22050Hz 采样的音频来说,帧长有 22050 * 0.025 = 551.25 个点,帧移有 22050 * 0.01 = 220.5 个点。根据上一篇文章-jupyter notebook完成wav文件探索,计算点数方法是采样率 * 时长,那么wav文件就有5.89569 * 22050 = 130000,和librosa.load返回的数据是一致的。num_samples、frame_len、frame_shift 分别代表音频的数据点数、帧长和帧移,那么i 帧的数据需要的点数:(i-1) * frame_shift + frame_len,n 个点的音频的帧数:ceil(n- / frame_shift) 。

    那么在librosa.load语音文件后,需要自己来分帧吗?NO,librosa已经帮你实现了!librosa.feature.mfcc函数提取MFCCs特征时,MFCC一般默认帧长为2048,帧移为512,即默认1/4关系。查看参考librosa文档:hop_length = win_length / 4,win_length = n_fft。n_fft=2048, hop_length=512。

        那么笔者再次在jupyter notebook中添加计算,发现和mfcc函数提取的帧数是一致的。那么在提取特征时就不需要自动来保证帧移的分帧。jupyter 真是太好用了,可以查看、修改历史过程,不用从头开始导入数据、分析数据了。

相关文章

  • 语音的帧长、帧移与帧数

    接着前面的文章,关于语音分帧问题,在前期将语音静音删除后,需要将语音裁剪成长度相同的长度或者分帧,保证数据集的...

  • 切片

    帧长 frame_len帧移 frame_shift重叠部分长度 frame_overlap

  • 图像撕裂、卡顿产生的原因以及解决方式

    图像显示的流程(单缓冲区) 理想情况下前一帧数据显示完成时,后一帧数据已经存入帧缓存去。这样循环,完美的显示图像。...

  • IBP帧介绍

    I帧:帧内编码帧 ,I帧表示关键帧,你可以理解为这一帧画面的完整保留;解码时只需要本帧数据就可以完成(因为包含完整...

  • 内容缓存与传输策略优化细节

    基础知识:I帧、B帧、P帧 I帧表示关键帧。你可以理解为这一帧画面的完整保留;解码时只需要本帧数据就可以完成。(因...

  • GOP/ 码流 /码率 / 比特率 / 帧速率 / 分辨率

    GOP(Group of picture) 关键帧的周期,也就是两个IDR帧之间的距离,一个帧组的最大帧数,一般而...

  • android MediaRecorder录制视频

    MediaRecorder可以实现直接录制视频,不能对每一帧数据进行处理。如果对每一帧数据都能进行处理的话,有两种...

  • 视频基础知识

    视频 视频采集装置一秒钟会捕捉几十帧数据,动画一般25帧以上,一般视频文件30帧数据,对于捕捉一些清晰动作的甚至要...

  • Elecard.Streameye4免费下载(可测试帧率/最大I

    Elecard.Streameye4免费下载 可测试:最大I帧/最大码率/I帧间隔/帧数/码流数据/YUV数据

  • requestIdleCallback和requestAnima

    页面流畅与 FPS 页面是一帧一帧绘制出来的,当每秒绘制的帧数(FPS)达到 60 时,页面是流畅的,小于这个值时...

网友评论

      本文标题:语音的帧长、帧移与帧数

      本文链接:https://www.haomeiwen.com/subject/bwnklrtx.html