美文网首页
百度语音识别

百度语音识别

作者: jiluyixia | 来源:发表于2019-11-20 16:32 被阅读0次

实现百度语音识别。
首先去https://ai.baidu.com/sdk#asr下载语音识别sdk。
下载的demo能直接运行,用as打开,若是出现错误

Cause: unable to find valid certification path to requested target

需要把gradle文件里面的两个jcenter()改为

  maven {
        url "http://jcenter.bintray.com"
}

可以参照demo和文档https://ai.baidu.com/docs#/ASR-Android-SDK/ac212c02,将识别部分的代码分离出来。

新建一个helloworld。
第一步:将demo里面jar包bdasr_V3_20190515_c9eed5d.jar导入到helloworld的libs目录,将jniLibs直接复制过来。

第二步:manifest里,将权限和APP_ID,service那些加进来:

<uses-permission android:name="android.permission.RECORD_AUDIO" />
    <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
    <uses-permission android:name="android.permission.INTERNET" />
    <uses-permission android:name="android.permission.READ_PHONE_STATE" />
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
    <meta-data
            android:name="com.baidu.speech.APP_ID"
            android:value="15590577"/>
    <meta-data
            android:name="com.baidu.speech.API_KEY"
            android:value="q2uPyBe6LmWTZlvb0g1dzcHV"/>
    <meta-data
            android:name="com.baidu.speech.SECRET_KEY"
            android:value="y7S7hAI894BB3LF1yHYmvQEus1B6wPvj"/>
<service android:name="com.baidu.speech.VoiceRecognitionService" android:exported="false" />

若是VoiceRecognitionService无法识别,在菜单中选择File > Invalidate Caches / Restart...,然后在弹出的对话框中选择Invalidate and Restart.,Android Studio会清除缓存且重启,重启后可以自动识别到导入的jar包

第三步:将IRecogListener.java,MyRecognizer.java,RecogEventAdapter.java,RecogResult.java四个文件复制过来。

准备工作已经做好,接下来,就可以在mainactivity里面用了。
将main.xml修改为:

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
    android:layout_width="fill_parent"
    android:layout_height="fill_parent"
    android:orientation="vertical">

    <TextView
        android:id="@+id/txtResult"
        android:layout_width="match_parent"
        android:layout_height="wrap_content"
        android:padding="8dp"
        android:textSize="18dp" />

    <View
        android:layout_width="match_parent"
        android:layout_height="1dp"
        android:background="#999" />

    <ScrollView
        android:layout_width="match_parent"
        android:layout_height="match_parent"
        android:layout_above="@+id/btn"
        android:layout_weight="1">

        <TextView
            android:id="@+id/txtLog"
            android:layout_width="match_parent"
            android:layout_height="match_parent"
            android:textSize="12dp" />
    </ScrollView>

    <Button
        android:id="@+id/btn_stop"
        android:layout_width="match_parent"
        android:layout_height="wrap_content"
        android:layout_alignParentBottom="true"
        android:text="停止" />

    <Button
        android:id="@+id/btn"
        android:layout_width="match_parent"
        android:layout_height="wrap_content"
        android:layout_alignParentBottom="true"
        android:text="开始" />
</LinearLayout>

初始化布局和获取权限:

initView();
initPermission();
private void initView() {
        txtResult = (TextView) findViewById(R.id.txtResult);
        txtLog = (TextView) findViewById(R.id.txtLog);
        btn = (Button) findViewById(R.id.btn);
        stopBtn = (Button) findViewById(R.id.btn_stop);
        txtLog.setText(DESC_TEXT + "\n");
    }

    /**
     * android 6.0 以上需要动态申请权限
     */
    private void initPermission() {
        String permissions[] = {Manifest.permission.RECORD_AUDIO,
                Manifest.permission.ACCESS_NETWORK_STATE,
                Manifest.permission.INTERNET,
                Manifest.permission.READ_PHONE_STATE,
                Manifest.permission.WRITE_EXTERNAL_STORAGE
        };

        ArrayList<String> toApplyList = new ArrayList<String>();

        for (String perm : permissions) {
            if (PackageManager.PERMISSION_GRANTED != ContextCompat.checkSelfPermission(this, perm)) {
                toApplyList.add(perm);
                // 进入到这里代表没有权限.

            }
        }
        String tmpList[] = new String[toApplyList.size()];
        if (!toApplyList.isEmpty()) {
            ActivityCompat.requestPermissions(this, toApplyList.toArray(tmpList), 123);
        }

    }
    @Override
    public void onRequestPermissionsResult(int requestCode, String[] permissions, int[] grantResults) {
        // 此处为android 6.0以上动态授权的回调,用户自行实现。
    }

创建MyRecognizer对象,用来调用开始录音结束录音,以及设置监听返回结果。

private MyRecognizer getAsrManager() {
        if (asrManager == null) {
           asrManager = new MyRecognizer(this, onAsrListener);
        }
        return asrManager;
}

这个onAsrListener,是自定义IRecogListener,用来获取RecogEventAdapter返回的结果。

private IRecogListener onAsrListener = new IRecogListener() {
        @Override
        public void onAsrReady() {

        }

        @Override
        public void onAsrBegin() {

        }

        @Override
        public void onAsrEnd() {

        }

        @Override
        public void onAsrPartialResult(String[] results, RecogResult recogResult) {

        }

        @Override
        public void onAsrOnlineNluResult(String nluResult) {

        }

        @Override
        public void onAsrFinalResult(String[] results, RecogResult recogResult) {
            txtResult.setText(results[0]);
        }

        @Override
        public void onAsrFinish(RecogResult recogResult) {

        }

        @Override
        public void onAsrFinishError(int errorCode, int subErrorCode, String descMessage, RecogResult recogResult) {
        }

        @Override
        public void onAsrLongFinish() {

        }

        @Override
        public void onAsrVolume(int volumePercent, int volume) {

        }

        @Override
        public void onAsrAudio(byte[] data, int offset, int length) {

        }

        @Override
        public void onAsrExit() {

        }

        @Override
        public void onOfflineLoaded() {

        }

        @Override
        public void onOfflineUnLoaded() {

        }
    };

MyRecognizer的构造方法需要修改为:

public MyRecognizer(Context context, IRecogListener listener) {
        if (isInited) {
            Log.e(TAG, "还未调用release(),请勿新建一个新类");
            throw new RuntimeException("还未调用release(),请勿新建一个新类");
        }
        isInited = true;
        // SDK集成步骤 初始化asr的EventManager示例,多次得到的类,只能选一个使用
        asr = EventManagerFactory.create(context, "asr");
        // SDK集成步骤 设置回调event, 识别引擎会回调这个类告知重要状态和识别结果
        asr.registerListener(eventListener = new RecogEventAdapter(listener));
}

关键在asr.registerListener(eventListener = new RecogEventAdapter(listener));
这一步绑定了RecogEventAdapter,RecogEventAdapter里面获取到识别结果,然后通过listener返回到mainactivity。
接下来,只用调用开始和结束了。

getAsrManager().start(params);
getAsrManager().stop();

另外,说一句话后,会自动停止录音并识别,并不需要手动停止。

需要注意的有以下几点:
一个是params,可以按照dome里面的设置:

Map<String, Object> params = new LinkedHashMap<String, Object>();
params.put(SpeechConstant.ACCEPT_AUDIO_VOLUME, false);

二个是上面用了demo自带的appid,可以去https://console.bce.baidu.com/ai/?_=1574239041289&fromai=1#/ai/speech/app/create
创建一个自己包名的appid。

三个是appid的那三个meta-data代码,要放在manifest的application里面,一开始和uses-permission一起放在了外面,结果识别不出来,点击开始录音,还会异常停止录音,还跑去提交工单问为啥。。

以上是基于demo封装的helloworld,代码如下:
https://github.com/doudousang/baiduaduio.git
基于sdk封装的只需要一个类即可(识别结果自己处理):
https://github.com/doudousang/baiduaudiosdk.git
封装语音识别的总工程如下:
https://github.com/doudousang/GoHomeAudio.git
参考代码:
Android Studio出现:Cause: unable to find valid certification path to requested target
解决Android Studio 导入jar包后无法识别,找不到相关类的问题

相关文章

网友评论

      本文标题:百度语音识别

      本文链接:https://www.haomeiwen.com/subject/pawoictx.html