安卓录制MP3(二) - LAME使用

作者: 嘉伟咯 | 来源:发表于2022-05-30 20:50 被阅读0次

    上篇文章介绍了数字音频的基础知识,这篇文章我们来看看代码应该怎么写:

    录音PCM

    第一步我们先用AudioRecord录制PCM音频:

    private lateinit var buffer: ByteArray
    
    fun start(audioSource: Int, sampleRate: Int, channelConfig: Int, audioFormat: Int): Boolean {
        ...
        val bufferSize = AudioRecord.getMinBufferSize(sampleRate, channelConfig, audioFormat)
    
        buffer = ByteArray(bufferSize)
        recorder = AudioRecord(audioSource, sampleRate, channelConfig, audioFormat, bufferSize)
    
        recorderThread = RecordThread()
        recorderThread?.start()
        return true
    }
    
    inner class RecordThread : Thread() {
        override fun run() {
            super.run()
    
            var readLen: Int
            recorder?.startRecording()
            while (recorder?.recordingState == AudioRecord.RECORDSTATE_RECORDING) {
                readLen = recorder?.read(buffer, 0, buffer.size) ?: break
                listener.onRecord(buffer, readLen)
            }
            recorder = null
        }
    }
    

    可以看到AudioRecord的使用很简单,就是创建一个AudioRecord对象然后在子线程中不断地read就好,audioSource指的是通过哪个设备录音,其他的几个参数在基础部分都有讲过,就不过多介绍了:

    private const val AUDIO_SOURCE = MediaRecorder.AudioSource.MIC
    private const val SAMPLE_RATE = 44100
    private const val AUDIO_FORMAT = AudioFormat.ENCODING_PCM_16BIT
    private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_MONO // 单通道
    //private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_STEREO // 双通道
    recorder.start(AUDIO_SOURCE, SAMPLE_RATE, CHANNEL_CONFIG, AUDIO_FORMAT)
    

    当然,记得需要申请录音权限:

    <uses-permission android:name="android.permission.RECORD_AUDIO" />
    

    使用LAME进行MP3编码

    得到PCM裸流之后我们就需要对他进行MP3编码,LAME就是一个开源的MP3音频压缩软件,也是公认有损MP3中压缩效果最好的编码器。

    编译

    使用LAME需要自行编译出静态库,首先我们从LAME的官网下载最新版本的LAME源码。从源码文件目录结构中可以看出它使用AutoMake编译,之前写过几篇AutoMake的学习笔记,感兴趣的同学可以看看。

    或者也可以直接修改Demo工程的build-lame.sh。修改开头的NDK路径、安卓版本、abi这几个参数接口直接运行在output目录生成出.a文件和.h文件:

    #!/bin/zsh
    
    NDK_ROOT=/Users/linjw/Library/Android/sdk/ndk/22.1.7171670
    ANDROID_API_VERSION=21
    NDK_TOOLCHAIN_ABI_VERSION=4.9
    ABIS=(armeabi armeabi-v7a arm64-v8a x86 x86_64)
    ...
    

    导入AndroidStudio

    得到静态库之后在CMake中导入静态库:

    cmake_minimum_required(VERSION 3.18.1)
    
    
    project("lame")
    
    add_library(
            lame
            SHARED
            native-lib.cpp)
    
    # 导入lame头文件
    include_directories(${CMAKE_SOURCE_DIR}/include)
    
    #导入lame静态库
    add_library(mp3lame STATIC IMPORTED)
    set_target_properties(
            mp3lame
            PROPERTIES IMPORTED_LOCATION
            ${CMAKE_SOURCE_DIR}/../../../jniLibs/${ANDROID_ABI}/libmp3lame.a)
    
    find_library(
            log-lib
            log)
    
    target_link_libraries(
            lame
            mp3lame # 链接lame静态库
            ${log-lib})
    

    lame基本使用

    初始化

    在了解了MP3的基础知识之后其实很容易上手lame。

    第一步无非就是一些音频参数的初始化设置:

    第一步: 创建lame_global_flags*
    lame_global_flags *client = lame_init();
    
    第二步: 配置参数
    lame_set_in_samplerate(client, 44100);    // 输入采样率
    lame_set_out_samplerate(client, 44100);   // 输出采样率44100
    lame_set_num_channels(client, 2);         // 通道数2
    lame_set_brate(client, 128);              // 比特率128kbps
    lame_set_quality(client, 2);              // 编码质量2
    lame_init_params(client);                 // 初始化参数
    

    编码质量

    上面的参数大部分都在前一篇介绍过了,只剩一个编码质量没讲过,他其实是用来选择压缩算法的。算法编号从0到9,0音质最好但是算法最复杂也最耗时,9音质最差但算法效率最高。一般会选择2。

    比特率和压缩算法都能决定MP3的音质。压缩前的PCM裸流音质最好,大小最大。

    由于MP3的大小等于比特率乘时长,压缩后的MP3比特率越大,那么它的大小就越大,就越接近压缩前的PCM,损失的信息也就越少,解压之后就越接近原本的PCM的曲线,音质自然就越好。

    而选择压缩算法的意义在于,在相同比特率的情况下( MP3文件大小相同),好的压缩算法解压出来的声音曲线能更接近原本的PCM曲线,但是相应的它的计算量就会更大。

    可以说选择大的比特率是用存储空间换音质,而选择音质高的压缩算法则是用cpu资源换音质。

    MP3编码

    配置好初始化参数之后就只要将PCM数据传递给LAME进行压缩即可,这里有几种PCM的传递方式:

    1. 左右通道分开输入

    双通道立体声,有时候左右通道的数据会放在不同的文件里面,可以使用下面的方法去编码MP3:

    int CDECL lame_encode_buffer (
            lame_global_flags*  gfp,           /* global context handle         */
            const short int     buffer_l [],   /* PCM data for left channel     */
            const short int     buffer_r [],   /* PCM data for right channel    */
            const int           nsamples,      /* number of samples per channel */
            unsigned char*      mp3buf,        /* pointer to encoded MP3 stream */
            const int           mp3buf_size ); /* number of valid octets in this stream */
    
    • gfp : lame_init返回的lame_global_flags*
    • buffer_l : 左通道数据
    • buffer_r : 右通道数据
    • nsamples : 每个通道的采样点数量。例如当AudioFormat为16bit的时候, 一个采样点大小为2byte, 则nsamples = buffer_l有效数据长度(byte) / 2
    • mp3buf : 编码后的MP3会存放到这里
    • mp3buf_size : mp3buf的大小,它可以通过采样率、比特率和前面的nsamples计算出来,不过LAME提供了一个最大buffer大小计算的简单算法(1.25*nsamples + 7200 byte)

    他的返回值如下:

    • >=0 : 编码后的MP3数据的大小,即存储到mp3buf的MP3音频的byte数
    • -1 : mp3buf的大小太小
    • -2 : malloc()方法出现问题
    • -3 : lame_init_params()没有调用
    • -4 : 音频数据异常

    参考代码:

    int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);
    

    2. 单通道输入

    有时候我们的数据只会有一个通道的数据,例如AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_MONO。

    这个时候我们只需要把right输入设置成NULL即可:

    int encodeSize = lame_encode_buffer(client, left, null, numSamples, result, resultSize);
    

    3. 多通道混合输入

    当AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_STEREO。左右声道的数据会交叉存储在PCM裸流中。或者其他更多通道混合输入的时候我们可以用lame_encode_buffer_interleaved方法进行编码:

    int CDECL lame_encode_buffer_interleaved(
            lame_global_flags*  gfp,           /* global context  handlei */
            short int           pcm[],         /* PCM data for left and right channel, interleaved */
            int                 num_samples,   /* number of samples per channel,  _not_ number of samples in pcm [] */
            unsigned char*      mp3buf,        /* pointer to encoded MP3 stream */
            int                 mp3buf_size ); /* number of valid octets in this stream */ 
    

    指的注意的是,这里的num_samples指的是每个通道的采样点数,而不是所有通道的采样点数之和。

    例如当AudioFormat为16bit、双通道输入的时候, 一个采样点大小为2byte, 则

    nsamples = buffer_l有效数据长度(byte) / 2(16bite为2byte) / 2(通道数为2)

    int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);
    

    清理工作

    当编码结束之后我们可以用lame_close方法进行清理:

    lame_close(client);
    

    结合JNI进行使用

    由于LAEM的使用需要保存lame_global_flags,我们可以将它强转成long传到java进行保存,在需要的时候再讲传入的long强转回lame_global_flags:

    class LameMp3 {
        private var lameClientPtr: Long = createLameMp3Client()
    
        fun destroy(): Int {
            val ret = close(lameClientPtr)
            lameClientPtr = 0
            return ret
        }
    
        ...
        private external fun createLameMp3Client(): Long
        private external fun close(client: Long): Int
        ...
    }
    
    extern "C" JNIEXPORT jlong JNICALL
    Java_me_linjw_lib_lame_LameMp3_createLameMp3Client(
            JNIEnv *env,
            jobject thiz) {
        lame_global_flags *client = lame_init();
        LOGD("createLameMp3Client: %ld", (long) client);
        return reinterpret_cast<jlong>(client);
    }
    
    
    extern "C" JNIEXPORT int JNICALL
    Java_me_linjw_lib_lame_LameMp3_close(
            JNIEnv *env,
            jobject thiz,
            jlong clientPtr) {
        lame_global_flags *client = reinterpret_cast<lame_global_flags *>(clientPtr);
        LOGD("close(%ld)", client);
        return lame_close(client);
    }
    

    详细代码参考LameMp3.ktnative-lib.cpp

    DEMO代码

    DEMO代码已经放到github

    相关文章

      网友评论

        本文标题:安卓录制MP3(二) - LAME使用

        本文链接:https://www.haomeiwen.com/subject/otcaprtx.html