美文网首页
ffmpeg 获取音频文件PCM切片

ffmpeg 获取音频文件PCM切片

作者: HelloHan | 来源:发表于2016-05-19 23:11 被阅读0次

    背景:为测试听歌识曲的sdk是否准确,获取一批测试音频(MP3格式) 的pcm 数据

    ffmpeg 工具获取、简介

    首先去ffmpeg 官网上获取相应工具 

    https://ffmpeg.zeranoe.com/builds/

    一共有三种类型可供选择,在这里只需要选择 static builds(选择相应系统)

    解压后,从bin目录下可以看到有三个可执行文件。大概功能为:

    ffmpeg.exe     也是这里的主角,可以负责音频格式的转换。

    ffplay.exe         一个播放器

    ffprobe.exe      集多媒体文件或流的信息,并以人和机器可读的方式输出

    ffmpeg.exe  获取PCM数据

    通过调用命令行 

    ffmpeg -ss 4 -t 16 -i input.mp3 -f s16le -acodec pcm_s16le -b:a 16 -ar 8000 - ac 1 output.raw

    相应配置项的解释:

    这一段获取的output 文件为    input.mp3  从4s 开始到20s  的数据 ,转存为 采样率8000khz,声道为单声道,位深为16bit  的pcm 原始数据 

    测试:

    结果:

    PCM文件如何打开?

    这点之前也不知道,后来查看到工具 Adobe Audition

    使用该软件打开raw文件,选择相应的编码格式。

    选择16位PCM

    就可以直接播放该PCM数据了

    获取的16s切片数据

    批量获取切片文件(Python)

    这里从github 找到了个能获取mp3 时长的库:

    https://github.com/devsnd/tinytag

    脚本存到在:

    相关文章

      网友评论

          本文标题:ffmpeg 获取音频文件PCM切片

          本文链接:https://www.haomeiwen.com/subject/zhglrttx.html