美文网首页Android开发Android开发Android技术知识
Android音频开发(4):PCM转WAV格式音频

Android音频开发(4):PCM转WAV格式音频

作者: android_赵乐玮 | 来源:发表于2018-08-09 17:25 被阅读23次

Android 音频开发 目录

  1. Android音频开发(1):音频相关知识
  2. Android音频开发(2):使用AudioRecord录制pcm格式音频
  3. Android音频开发(3):使用AudioRecord实现录音的暂停和恢复
  4. Android音频开发(4):PCM转WAV格式音频
  5. Android音频开发(5):Mp3的录制 - 编译Lame源码
  6. Android音频开发(6):Mp3的录制 - 使用Lame实时录制MP3格式音频

项目地址

https://github.com/zhaolewei/ZlwAudioRecorder


前面几篇已经介绍了PCM音频文件的录制,这一篇主要介绍下pcm转wav。

一、wav 和 pcm

一般通过麦克风采集的录音数据都是PCM格式的,即不包含头部信息,播放器无法知道音频采样率、位宽等参数,导致无法播放,显然是非常不方便的。pcm转换成wav,我们只需要在pcm的文件起始位置加上至少44个字节的WAV头信息即可。

RIFF

  • WAVE文件是以RIFF(Resource Interchange File Format, "资源交互文件格式")格式来组织内部结构的
    RIFF文件结构可以看作是树状结构,其基本构成是称为"块"(Chunk)的单元.
  • WAVE文件是由若干个Chunk组成的。按照在文件中的出现位置包括:RIFF WAVE Chunk, Format Chunk, Fact Chunk(可选), Data Chunk。

Fact Chunk 在压缩后或在非PCM编码时存在

二、WAV头文件

所有的WAV都有一个文件头,这个文件头记录着音频流的编码参数。数据块的记录方式是little-endian字节顺序。

image
偏移地址 命名 内容
00-03 ChunkId "RIFF"
04-07 ChunkSize 下个地址开始到文件尾的总字节数(此Chunk的数据大小)
08-11 fccType "WAVE"
12-15 SubChunkId1 "fmt ",最后一位空格。
16-19 SubChunkSize1 一般为16,表示fmt Chunk的数据块大小为16字节,即20-35
20-21 FormatTag 1:表示是PCM 编码
22-23 Channels 声道数,单声道为1,双声道为2
24-27 SamplesPerSec 采样率
28-31 BytesPerSec 码率 :采样率 * 采样位数 * 声道个数,bytePerSecond = sampleRate * (bitsPerSample / 8) * channels
32-33 BlockAlign 每次采样的大小:位宽*声道数/8
34-35 BitsPerSample 位宽
36-39 SubChunkId2 "data"
40-43 SubChunkSize2 音频数据的长度
44-... data 音频数据

三、java 生成头文件

  1. WavHeader.class
    public static class WavHeader {
        /**
         * RIFF数据块
         */
        final String riffChunkId = "RIFF";
        int riffChunkSize;
        final String riffType = "WAVE";
    
        /**
         * FORMAT 数据块
         */
        final String formatChunkId = "fmt ";
        final int formatChunkSize = 16;
        final short audioFormat = 1;
        short channels;
        int sampleRate;
        int byteRate;
        short blockAlign;
        short sampleBits;
    
        /**
         * FORMAT 数据块
         */
        final String dataChunkId = "data";
        int dataChunkSize;
    
        WavHeader(int totalAudioLen, int sampleRate, short channels, short sampleBits) {
            this.riffChunkSize = totalAudioLen;
            this.channels = channels;
            this.sampleRate = sampleRate;
            this.byteRate = sampleRate * sampleBits / 8 * channels;
            this.blockAlign = (short) (channels * sampleBits / 8);
            this.sampleBits = sampleBits;
            this.dataChunkSize = totalAudioLen - 44;
        }
    
        public byte[] getHeader() {
            byte[] result;
            result = ByteUtils.merger(ByteUtils.toBytes(riffChunkId), ByteUtils.toBytes(riffChunkSize));
            result = ByteUtils.merger(result, ByteUtils.toBytes(riffType));
            result = ByteUtils.merger(result, ByteUtils.toBytes(formatChunkId));
            result = ByteUtils.merger(result, ByteUtils.toBytes(formatChunkSize));
            result = ByteUtils.merger(result, ByteUtils.toBytes(audioFormat));
            result = ByteUtils.merger(result, ByteUtils.toBytes(channels));
            result = ByteUtils.merger(result, ByteUtils.toBytes(sampleRate));
            result = ByteUtils.merger(result, ByteUtils.toBytes(byteRate));
            result = ByteUtils.merger(result, ByteUtils.toBytes(blockAlign));
            result = ByteUtils.merger(result, ByteUtils.toBytes(sampleBits));
            result = ByteUtils.merger(result, ByteUtils.toBytes(dataChunkId));
            result = ByteUtils.merger(result, ByteUtils.toBytes(dataChunkSize));
            return result;
        }
    }
    

ByteUtils: https://github.com/zhaolewei/ZlwAudioRecorder/blob/master/recorderlib/src/main/java/com/zlw/main/recorderlib/utils/ByteUtils.java

四、PCM转Wav

  1. WavUtils.java
public class WavUtils {
    private static final String TAG = WavUtils.class.getSimpleName();
        /**
         * 生成wav格式的Header
         * wave是RIFF文件结构,每一部分为一个chunk,其中有RIFF WAVE chunk,
         * FMT Chunk,Fact chunk(可选),Data chunk
         *
         * @param totalAudioLen 不包括header的音频数据总长度
         * @param sampleRate    采样率,也就是录制时使用的频率
         * @param channels      audioRecord的频道数量
         * @param sampleBits    位宽
         */
        public static byte[] generateWavFileHeader(int totalAudioLen, int sampleRate, int channels, int sampleBits) {
            WavHeader wavHeader = new WavHeader(totalAudioLen, sampleRate, (short) channels, (short) sampleBits);
            return wavHeader.getHeader();
        }
    }

    /**
     * 将header写入到pcm文件中 不修改文件名
     *
     * @param file   写入的pcm文件
     * @param header wav头数据
     */
    public static void writeHeader(File file, byte[] header) {
        if (!FileUtils.isFile(file)) {
            return;
        }

        RandomAccessFile wavRaf = null;
        try {
            wavRaf = new RandomAccessFile(file, "rw");
            wavRaf.seek(0);
            wavRaf.write(header);
            wavRaf.close();
        } catch (Exception e) {
            Logger.e(e, TAG, e.getMessage());
        } finally {
            try {
                if (wavRaf != null) {
                    wavRaf.close();
                }
            } catch (IOException e) {
                Logger.e(e, TAG, e.getMessage());
            }
        }
  1. RecordHelper.java
private void makeFile() {
    mergePcmFiles(recordFile, files);

    //这里实现上一篇未完成的工作
    byte[] header = WavUtils.generateWavFileHeader((int) resultFile.length(), currentConfig.getSampleRate(), currentConfig.getChannelCount(), currentConfig.getEncoding());
    WavUtils.writeHeader(resultFile, header);
    
    Logger.i(TAG, "录音完成! path: %s ; 大小:%s", recordFile.getAbsoluteFile(), recordFile.length());
    }

参考链接:

  1. http://soundfile.sapp.org/doc/WaveFormat/

相关文章

网友评论

    本文标题:Android音频开发(4):PCM转WAV格式音频

    本文链接:https://www.haomeiwen.com/subject/pzycbftx.html