美文网首页
android TTS TextToSpeech

android TTS TextToSpeech

作者: zsw0828 | 来源:发表于2019-08-15 11:03 被阅读0次

    前言

    最近公司产品提出需求:要在一个收音机广告app上新增一个小说文本朗读的功能。我第一反应是接入讯飞或者其他平台的语音sdk,可是产品说预算有限,而那些平台需要收费,而且价格不低,让我想其他方法实现。

    后面再经过baidu google之后发现android原生提供了 TextToSpeech来处理文字转语音的功能。

    TextToSpeech存在的问题:

    目前只支持 英文、法文、意大利文、德文、西班牙文,暂不支持中文播放

    测试

    我在小米手机上跑了 TextToSpeech的测试demo,发现能播报中文,查看小米手机的系统设置里发现其默认的tts是小爱同学引擎。

    后来测试了华为,vivo等国产手机机型,发现都够正常播放中文文字。因为手头没有google的nexus设备,因此没有测试,但是应该是没有办法播放的。

    确认详细需求

    后期跟产品确定详细需求时,发现他的要求大致是希望能做一个小说朗读播放器,可以拖动播放进度,有总时长,当前播放长度,暂停、开始,播放下一章,上一章文本,以及定时关闭等功能。

    开始实现

    • 先引用一个网上使用textToSpeech的原文
    public class MainActivity extends AppCompatActivity  implements View.OnClickListener, TextToSpeech.OnInitListener {
        private Button speechBtn; // 按钮控制开始朗读
        private EditText speechTxt; // 需要朗读的内容
        private TextToSpeech textToSpeech; // TTS对象
        @Override
        public void onCreate(Bundle savedInstanceState) {
            super.onCreate(savedInstanceState);
            setContentView(R.layout.activity_main);
            speechBtn = (Button) findViewById(R.id.btn_read);
            speechBtn.setOnClickListener(this);
            speechTxt = (EditText) findViewById(R.id.editText);
            textToSpeech = new TextToSpeech(this, this); // 参数Context,TextToSpeech.OnInitListener
        }
        /**
         * 用来初始化TextToSpeech引擎
         * status:SUCCESS或ERROR这2个值
         * setLanguage设置语言,帮助文档里面写了有22种
         * TextToSpeech.LANG_MISSING_DATA:表示语言的数据丢失。
         * TextToSpeech.LANG_NOT_SUPPORTED:不支持
         */
        @Override
        public void onInit(int status) {
            if (status == TextToSpeech.SUCCESS) {
                int result = textToSpeech.setLanguage(Locale.CHINA);
                if (result == TextToSpeech.LANG_MISSING_DATA
                        || result == TextToSpeech.LANG_NOT_SUPPORTED) {
                    Toast.makeText(this, "数据丢失或不支持", Toast.LENGTH_SHORT).show();
                }
            }
        }
        @Override
        public void onClick(View v) {
            if (textToSpeech != null && !textToSpeech.isSpeaking()) {
              // 设置音调,值越大声音越尖(女生),值越小则变成男声,1.0是常规
                textToSpeech.setPitch(0.5f);
              //设定语速 ,默认1.0正常语速
               textToSpeech.setSpeechRate(1.5f);
              //朗读,注意这里三个参数的added in API level 4   四个参数的added in API level 21
                textToSpeech.speak(speechTxt.getText().toString(), TextToSpeech.QUEUE_FLUSH, null);
            }
        }
        @Override
        protected void onStop() {
            super.onStop();
            textToSpeech.stop(); // 不管是否正在朗读TTS都被打断
            textToSpeech.shutdown(); // 关闭,释放资源
        }
    }
    
    • 其中主要的几个方法有:
    /**
     * text 需要转成语音的文字 
     * queueMode 队列方式: 
     * QUEUE_ADD:播放完之前的语音任务后才播报本次内容 
     * QUEUE_FLUSH:丢弃之前的播报任务,立即播报本次内容 
     * params 设置TTS参数,可以是null。 
     * KEY_PARAM_STREAM:音频通道,可以是:STREAM_MUSIC、STREAM_NOTIFICATION、STREAM_RING等 
     * KEY_PARAM_VOLUME:音量大小,0-1f 
     * utteranceId:当前朗读文本的id
     */
    textToSpeech.speak(content, TextToSpeech.QUEUE_FLUSH, null,i+"");
    // 不管是否正在朗读TTS都被打断
    textToSpeech.stop();       
    // 关闭,释放资源
    textToSpeech.shutdown(); 
    // 设置音调,值越大声音越尖(女生),值越小则变成男声,1.0是常规
    textToSpeech.setPitch(0.5f);
    // 设定语速,默认1.0正常语速
    textToSpeech.setSpeechRate(1.5f);
    
    • 在我获取content文本 调用
    textToSpeech.speak(content, TextToSpeech.QUEUE_FLUSH, null,i+"");
    

    却没有正常播放声音。在对照之前可播放声音的demo后,发现除了文本外,其余内容一致。TextToSpeech的最大播放文本长度是4000字。因此我采取的策略是将一段长文本拆分成多段短文本内容,然后播报时采用

    for (int i = 0; i < readContentList.size(); i++) {
        textToSpeech.speak(readContentList.get(i), TextToSpeech.QUEUE_ADD, null,i+"");
    }
    

    拆分长文本代码如下:

    //长文本拆分
        public static List<String> splitContent(String content){
            //[\u4E00-\u9FA5]是unicode2的中文区间
            Pattern pattern = Pattern.compile("[^\u4E00-\u9FA5]");
            Matcher matcher = pattern.matcher(content);
            content = matcher.replaceAll("");           //提取中文文本
    
            int startIndex = 0;
            int contentLength = 10;
            List<String> contentList = new ArrayList<>();
            while(startIndex<content.length()-1){
                if (startIndex + contentLength > content.length()){
                    contentLength = content.length()-startIndex;
                }
                String contentTemp = content.substring(startIndex,startIndex+contentLength);
                contentList.add(contentTemp);
                startIndex = startIndex + contentLength;
            }
            return contentList;
        }
    

    我个人是将文本拆成10个字一段。

    • 总结一下:
      其实目前下来 文本朗读功能基本完成了,只需要将小说文本拆解成多段文本,然后添加到TextToSpeech中就可以了。剩下来的难点我认为主要在于播放器这一块。
      播放器的功能点有以下几点:
    1. 播放/暂停按钮
    2. 上一章/下一章文本
    3. 可拖动的进度条
    4. 定时关闭

    下面开始一点一点处理,因为是公司项目,所以可能主要是记录自己开发过程中的逻辑处理思路:

    首先 下面这段代码是TextToSpeech的朗读监听方法,我们可以根据 onStart(String utteranceId),和onDone(String utteranceId) 来判断 当前播放的是第几段声音(utteranceId是在调用 TextToSpeech.speak(...)时设置的最后一个参数)。

    我们可以在onStart(String utteranceId)中记录当前播放的是第几段声音

    textToSpeech.setOnUtteranceProgressListener(new UtteranceProgressListener() {
                    @Override
                    public void onStart(String utteranceId) {
                        // TODO: 2019/8/15 textToSpeech 开始播放 
                        // TODO: 2019/8/15 utteranceId即为 textToSpeech.speak("","",null,i)最后一个参数i
                        
                    }
    
                    @Override
                    public void onDone(String utteranceId) {
                        // TODO: 2019/8/15 当前文本播放完毕 
                
                    }
    
                    @Override
                    public void onError(String utteranceId) {
    
                    }
                });
    
    • 播放器 播放/暂停按钮

    点击暂停时调用:

     if (textToSpeech!=null){
        textToSpeech.stop();        //退出循环播放或者说停止播报
     }
    

    在点击播放 按钮时重新调用:

    // progressIndex 为朗读监听方法onStart(String utteranceId){}中记录的当前文本进度
    for (int i = progressIndex; i < readContentList.size(); i++) {
        textToSpeech.speak(readContentList.get(i), TextToSpeech.QUEUE_ADD, null,i+"");
     }
    
    

    这样恢复播放会存在一个问题,例如上一段文本正朗读到第8个字,我点击暂停后再重新朗读,又会从第一个字开始朗读。
    可以将每段文本拆分的更细,甚至一个字为1段来解决这个问题(我试过,但是朗读过程会有卡顿的感觉)。

    • 上/下一章播放
      获取新文本内容,清除旧文本数据后,将新文本拆分重新调用 TextToSpeech.speak()方法即可

    • 可拖动进度条
      前面已经提到,将一章小说拆分成多段文本(readContentList),那么进度条的总长度就可以根据这个多段文本的长度来设置

    seekbar.setMax(readContentList.size());
    

    其进度条时长可以通过每段朗读所需时间 * 文本长度

    long seekbarTime = readTime * readContentList.size();
    

    每段文本朗读所需时长 可根据监听方法里的两次onStart(...)做一个时间差,来计算朗读一段文本所需时长。但经过本人计算,每次朗读第一次会特别耗时,其大致每10个字的粗略值是需要耗时2800毫秒。

    每次拖动进度条,根据其progress来重新定位播放位置。

    • 定时关闭
      可以重开一个子线程进行倒计时,然后执行 TextToSpeech.stop()即可

    相关文章

      网友评论

          本文标题:android TTS TextToSpeech

          本文链接:https://www.haomeiwen.com/subject/zqwajctx.html