1、先构建最小音频录制缓冲区,通过getMinBufferSize 获取,
public static int getMinBufferSize (int sampleRateInHz,
int channelConfig,
int audioFormat)
int BUFFER_SIZE = AudioRecord.getMinBufferSize(SAMPLE_RATE_IN_HZ,
AudioFormat.CHANNEL_IN_DEFAULT, AudioFormat.ENCODING_PCM_16BIT);
参数介绍:
sampleRateInHz:音频采样率,一般为可选的三个-> 8000Hz 、16000Hz、44100Hz ,还有其他的
说明:采样率当然越高越好,但是并非越好的采样率,它就能给你的带来更好的开发,因为有些设置不支持,哈哈哈。常用的16000和 44100 但是可能还会出现极个别的手机等出现小问题,所以,为了更好的适配,建议你选择16000 当然选择8000更好。
channelConfig:音频通道的配置,可选的有-> AudioFormat.CHANNEL_IN_MONO 单声道,CHANNEL_IN_STEREO为双声道,立体声道,我们普通选择单声道就行
audioFormat:音频数据的格式,可选的有-> AudioFormat.ENCODING_PCM_8BIT,AudioFormat.ENCODING_PCM_16BIT(听说这个好像跟音频通道有关,8Bit 选择单声道,16bit 选择双声道,我不是太清楚,我选的是16Bit 的单声道,没发现上面问题,如谁知道请告知,谢谢)
2、第一步结束后,开始构建AudioRecord对象了
AudioRecord(int audioSource, int sampleRateInHz, int channelConfig, int audioFormat, int bufferSizeInBytes)
AudioRecord mAudioRecord = new AudioRecord(MediaRecorder.AudioSource.VOICE_RECOGNITION,
SAMPLE_RATE_IN_HZ, AudioFormat.CHANNEL_IN_DEFAULT,
AudioFormat.ENCODING_PCM_16BIT, BUFFER_SIZE)
参数介绍:
audioSource:第一个参数,表示接受外接音频的音源(一般我们选择主麦克风的音源),
AudioSource可以设置的来源包括:
MediaRecorder.AudioSource.CAMCORDER :设定录音来源于同方向的相机麦 克风相同,若相机无内置相机或无法识别,则使用预设的麦克风
MediaRecorder.AudioSource.DEFAULT : 默认音频源
MediaRecorder.AudioSource.MIC:设定录音来源为主麦克风。
MediaRecorder.AudioSource.VOICE_CALL:设定录音来源为语音拨出的语音与对方说话的声音
MediaRecorder.AudioSource.VOICE_COMMUNICATION:摄像头旁边的麦克风
MediaRecorder.AudioSource.VOICE_DOWNLINK:下行声音
MediaRecorder.AudioSource.VOICE_RECOGNITION:语音识别
MediaRecorder.AudioSource.VOICE_UPLINK:上行声音
————————————————
第二个参数和第三个参数,在第一步中已经介绍过来,和它一样设置就行
第三个参数:这个参数就是第一步获取的值,这里我用的是:BUFFER_SIZE
-----到这里,前期的配置基本结束,下面就可以开启录制,获取外部音源的数据了-------
当你在需要的时候,就可以调用 第二部创建的 对象mAudioRecord 来调用开启录制,开启后,就可以获取外部音源数据了,
切记:当你调用 下面这步:
mAudioRecord.startRecording();
后,确实就可以读取到外部音源数据了,但是,但是,但是,并不意味着,只要开启startRecording() 就必须一定要去把音源数据存下来到本地。因为你可以能并不一定要把获取的声音数据存下来,根据需求,可能你只是要监听声音呢?为什么这么说?因为笔者就是这样的,在未做这块之前,我一直以为,只要录音,就会存储数据,因为自己没这么搞过,一直是照搬别人的,所以才有这样的误解。
笔者的需求是:要不停的监听外部音源,然后根据声音的大小,当声音大小符合我设置的阀值,我在把音频数据存储下来,然后去播放,类似会说话的tom猫,当听到外部有声音时,就竖起耳朵听,听到后,就把声音存储下来,然后当声音小了,就把这一小段声音通过变声然后播放出来。
第三步,获取音频数据,
因为上面准备工作做好之后,在需要的时候,调用startRecording() 后,就已经开启了录制模式,就可以获取外部声音数据了
** 注意 ** 获取外部声音的行为要在子线程操作 , startRecording() 也是可以在子线程调用
1、获取外部音频数据
// 这里我定义个成员变量,isRunning , 用来控制循环接收读取声音数据的
boolean isRunning = true;
new Thread(new Runnable() {
@Override
public void run() {
// 定义一个用于接收音频数据的byte字节数组,长度为前面定义的字节大小,读取的数据大小,缓存大小
byte[] buffer = new byte[BUFFER_SIZE];
while (isRunning){
// 参数 0 表示目标数组 buffer 的起始偏移量,一般是 0
int audioSize = mAudioRecord.read(buffer, 0, BUFFER_SIZE);
// 下面就可以把读到的数据记录下来了
}
}
}).start();
2、获取外部音频数据,并写入本地
// 这里我定义个成员变量,isRunning , 用来控制循环接收读取声音数据的
boolean isRunning = true;
new Thread(new Runnable() {
@Override
public void run() {
// 定义一个用于接收音频数据的byte字节数组,长度为前面定义的字节大小,读取的数据大小,缓存大小
byte[] buffer = new byte[BUFFER_SIZE];
FileOutputStream fos = null;
try {
// 注意:这里直接获取的音频是 pcm 格式的,所以FileOutputStream 中的路径要是pcm 格式的文件
// 如果是想要其他格式的 你可以直接边读,边转,再或者,读完后,在进行格式转换
fos = new FileOutputStream("你需要保持的绝对路径,带文件后缀名.pcm", false);
while (isRunning) {
// 参数 0 表示目标数组 buffer 的起始偏移量,一般是 0
int readSize = mAudioRecord.read(buffer, 0, BUFFER_SIZE);
// 下面就可以把读到的数据记录下来了
if (readSize != AudioRecord.ERROR_INVALID_OPERATION){
// 读取到的数据正常,就开始写入了
if (readSize > 0 && readSize <= buffer.length){
fos.write(buffer,0,readSize);
}
}
}
} catch (Exception e) {
e.printStackTrace();
}
if (fos != null){
try {
fos.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}).start();
下面是关于根据读取的音频数据,获取外部音源的声音相关的分析
说道这里,我有个大大的问题,关于在读取音频数据的时候,系统提供了好几个read 方法,看起来很棒,但是也给我们留一个不好处理的问题,
你既可以定义byte 字节数组去接收数据,你也可以定义short数组接收,我查找发现,获取声音的大小时,用short对音频的声音大小获取很好,值变化比较大,但是,我用byte 时,就不太行,获取的声音大小变化不大,还经常受外部环境声音影响,虽然网上说可以转换,但是转换后,只能说还行,也算不上多好。
还有就是,我既要获取外部声音,还要在符合条件时,把声音数据写入本地,这他娘的,read 既可以读byte 也可以读short 但是,你在写的时候,FileOutputStream只接收byte ,心里一顿CNM的 一顿臭骂,别逼没办法,还得用byte接收数据,然后声音需要把byte 处理一下,这里我就直接记录一下处理方式。
下面的代码是在read之后的,前面的省略 (这段代码用kotlin)
// 获取音量 ==== 2
var voice = 0.0
var v = 0L
val shortBuffer = bytesToShort(buffer)
shortBuffer?.let {
for (i in shortBuffer.indices){
v += shortBuffer[i] * shortBuffer[i]
}
val mean = v / readSize.toDouble()
// 这里的voice 就是计算的声音,感觉不是太灵敏,变化不大,容易受外部环境的影响。
voice = 10 * Math.log10(mean)
}
private fun bytesToShort(bytes: ByteArray?): ShortArray? {
if (bytes == null) {
return null
}
val shorts = ShortArray(bytes.size / 2)
ByteBuffer.wrap(bytes).order(ByteOrder.LITTLE_ENDIAN).asShortBuffer()[shorts]
return shorts
}
今天的学习暂时先记录到这,以供以后查看。
网友评论