android TTS TextToSpeech

作者: zsw0828 | 来源:发表于2019-08-15 11:03 被阅读0次

android TTS TextToSpeech
Android TTS(TextToSpeech) 使用
文字转化为语音Android中TextToSpeech类的简单使
Android 语音TTS简介
Android小说中的语音阅读
NeoSpeech语音合成引擎，最新正版安装包下载
TTS离线语音合成的叨逼叨及解决方案
Node.js结合百度TTS接口实现文字转语音功能
编写使用Android 系统自带的文字转语音代码
Android TTS 语音合成播报

前言

最近公司产品提出需求:要在一个收音机广告app上新增一个小说文本朗读的功能。我第一反应是接入讯飞或者其他平台的语音sdk，可是产品说预算有限，而那些平台需要收费，而且价格不低，让我想其他方法实现。

后面再经过baidu google之后发现android原生提供了 TextToSpeech来处理文字转语音的功能。

TextToSpeech存在的问题:

目前只支持英文、法文、意大利文、德文、西班牙文,暂不支持中文播放

测试

我在小米手机上跑了 TextToSpeech的测试demo，发现能播报中文，查看小米手机的系统设置里发现其默认的tts是小爱同学引擎。

后来测试了华为，vivo等国产手机机型，发现都够正常播放中文文字。因为手头没有google的nexus设备，因此没有测试，但是应该是没有办法播放的。

确认详细需求

后期跟产品确定详细需求时，发现他的要求大致是希望能做一个小说朗读播放器，可以拖动播放进度，有总时长，当前播放长度，暂停、开始，播放下一章，上一章文本，以及定时关闭等功能。

开始实现

先引用一个网上使用textToSpeech的原文

public class MainActivity extends AppCompatActivity  implements View.OnClickListener, TextToSpeech.OnInitListener {
    private Button speechBtn; // 按钮控制开始朗读
    private EditText speechTxt; // 需要朗读的内容
    private TextToSpeech textToSpeech; // TTS对象
    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        speechBtn = (Button) findViewById(R.id.btn_read);
        speechBtn.setOnClickListener(this);
        speechTxt = (EditText) findViewById(R.id.editText);
        textToSpeech = new TextToSpeech(this, this); // 参数Context,TextToSpeech.OnInitListener
    }
    /**
     * 用来初始化TextToSpeech引擎
     * status:SUCCESS或ERROR这2个值
     * setLanguage设置语言，帮助文档里面写了有22种
     * TextToSpeech.LANG_MISSING_DATA：表示语言的数据丢失。
     * TextToSpeech.LANG_NOT_SUPPORTED:不支持
     */
    @Override
    public void onInit(int status) {
        if (status == TextToSpeech.SUCCESS) {
            int result = textToSpeech.setLanguage(Locale.CHINA);
            if (result == TextToSpeech.LANG_MISSING_DATA
                    || result == TextToSpeech.LANG_NOT_SUPPORTED) {
                Toast.makeText(this, "数据丢失或不支持", Toast.LENGTH_SHORT).show();
            }
        }
    }
    @Override
    public void onClick(View v) {
        if (textToSpeech != null && !textToSpeech.isSpeaking()) {
          // 设置音调，值越大声音越尖（女生），值越小则变成男声,1.0是常规
            textToSpeech.setPitch(0.5f);
          //设定语速 ，默认1.0正常语速
           textToSpeech.setSpeechRate(1.5f);
          //朗读，注意这里三个参数的added in API level 4   四个参数的added in API level 21
            textToSpeech.speak(speechTxt.getText().toString(), TextToSpeech.QUEUE_FLUSH, null);
        }
    }
    @Override
    protected void onStop() {
        super.onStop();
        textToSpeech.stop(); // 不管是否正在朗读TTS都被打断
        textToSpeech.shutdown(); // 关闭，释放资源
    }
}

其中主要的几个方法有:

/**
 * text 需要转成语音的文字 
 * queueMode 队列方式： 
 * QUEUE_ADD：播放完之前的语音任务后才播报本次内容 
 * QUEUE_FLUSH：丢弃之前的播报任务，立即播报本次内容 
 * params 设置TTS参数，可以是null。 
 * KEY_PARAM_STREAM：音频通道，可以是：STREAM_MUSIC、STREAM_NOTIFICATION、STREAM_RING等 
 * KEY_PARAM_VOLUME：音量大小，0-1f 
 * utteranceId：当前朗读文本的id
 */
textToSpeech.speak(content, TextToSpeech.QUEUE_FLUSH, null,i+"");
// 不管是否正在朗读TTS都被打断
textToSpeech.stop();       
// 关闭，释放资源
textToSpeech.shutdown(); 
// 设置音调,值越大声音越尖（女生），值越小则变成男声,1.0是常规
textToSpeech.setPitch(0.5f);
// 设定语速,默认1.0正常语速
textToSpeech.setSpeechRate(1.5f);

在我获取content文本调用

textToSpeech.speak(content, TextToSpeech.QUEUE_FLUSH, null,i+"");

却没有正常播放声音。在对照之前可播放声音的demo后，发现除了文本外，其余内容一致。TextToSpeech的最大播放文本长度是4000字。因此我采取的策略是将一段长文本拆分成多段短文本内容，然后播报时采用

for (int i = 0; i < readContentList.size(); i++) {
    textToSpeech.speak(readContentList.get(i), TextToSpeech.QUEUE_ADD, null,i+"");
}

拆分长文本代码如下:

//长文本拆分
    public static List<String> splitContent(String content){
        //[\u4E00-\u9FA5]是unicode2的中文区间
        Pattern pattern = Pattern.compile("[^\u4E00-\u9FA5]");
        Matcher matcher = pattern.matcher(content);
        content = matcher.replaceAll("");           //提取中文文本

        int startIndex = 0;
        int contentLength = 10;
        List<String> contentList = new ArrayList<>();
        while(startIndex<content.length()-1){
            if (startIndex + contentLength > content.length()){
                contentLength = content.length()-startIndex;
            }
            String contentTemp = content.substring(startIndex,startIndex+contentLength);
            contentList.add(contentTemp);
            startIndex = startIndex + contentLength;
        }
        return contentList;
    }

我个人是将文本拆成10个字一段。

总结一下:
其实目前下来文本朗读功能基本完成了，只需要将小说文本拆解成多段文本，然后添加到TextToSpeech中就可以了。剩下来的难点我认为主要在于播放器这一块。
播放器的功能点有以下几点:

播放/暂停按钮
上一章/下一章文本
可拖动的进度条
定时关闭

下面开始一点一点处理，因为是公司项目，所以可能主要是记录自己开发过程中的逻辑处理思路:

首先下面这段代码是TextToSpeech的朗读监听方法，我们可以根据 onStart(String utteranceId),和onDone(String utteranceId) 来判断当前播放的是第几段声音(utteranceId是在调用 TextToSpeech.speak(...)时设置的最后一个参数)。

我们可以在onStart(String utteranceId)中记录当前播放的是第几段声音

textToSpeech.setOnUtteranceProgressListener(new UtteranceProgressListener() {
                @Override
                public void onStart(String utteranceId) {
                    // TODO: 2019/8/15 textToSpeech 开始播放 
                    // TODO: 2019/8/15 utteranceId即为 textToSpeech.speak("","",null,i)最后一个参数i
                    
                }

                @Override
                public void onDone(String utteranceId) {
                    // TODO: 2019/8/15 当前文本播放完毕 
            
                }

                @Override
                public void onError(String utteranceId) {

                }
            });

播放器播放/暂停按钮

点击暂停时调用:

 if (textToSpeech!=null){
    textToSpeech.stop();        //退出循环播放或者说停止播报
 }

在点击播放按钮时重新调用：

// progressIndex 为朗读监听方法onStart(String utteranceId){}中记录的当前文本进度
for (int i = progressIndex; i < readContentList.size(); i++) {
    textToSpeech.speak(readContentList.get(i), TextToSpeech.QUEUE_ADD, null,i+"");
 }

这样恢复播放会存在一个问题，例如上一段文本正朗读到第8个字，我点击暂停后再重新朗读，又会从第一个字开始朗读。
可以将每段文本拆分的更细，甚至一个字为1段来解决这个问题(我试过，但是朗读过程会有卡顿的感觉)。

上/下一章播放
获取新文本内容，清除旧文本数据后，将新文本拆分重新调用 TextToSpeech.speak()方法即可
可拖动进度条
前面已经提到，将一章小说拆分成多段文本(readContentList)，那么进度条的总长度就可以根据这个多段文本的长度来设置

seekbar.setMax(readContentList.size());

其进度条时长可以通过每段朗读所需时间 * 文本长度

long seekbarTime = readTime * readContentList.size();

每段文本朗读所需时长可根据监听方法里的两次onStart(...)做一个时间差，来计算朗读一段文本所需时长。但经过本人计算，每次朗读第一次会特别耗时，其大致每10个字的粗略值是需要耗时2800毫秒。

每次拖动进度条，根据其progress来重新定位播放位置。

定时关闭
可以重开一个子线程进行倒计时，然后执行 TextToSpeech.stop()即可

android TTS TextToSpeech
前言最近公司产品提出需求:要在一个收音机广告app上新增一个小说文本朗读的功能。我第一反应是接入讯飞或者其他平台...
Android TTS(TextToSpeech) 使用
TTS 是什么？ TTS 是 Text To Speech 的缩写，即“从文本到语音”，是人机对话的一部分，让机器...
文字转化为语音Android中TextToSpeech类的简单使
TTS（从文本到语音(TextToSpeech)） TTS是Text To Speech的缩写，即“从文本到语音”...
Android 语音TTS简介
TextToSpeech简称 TTS，是Android 1.6版本中比较重要的新功能。将所指定的文本转成不同语言音...
Android小说中的语音阅读
TTS （从文本到语音(TextToSpeech)）点击链接进去了解TTS技术这里就不赘述了下面测试的dem...
NeoSpeech语音合成引擎，最新正版安装包下载
语音合成（Speechsynthesis，或是TextToSpeech），简称TTS技术。它涉及声学、语言学、数字...
TTS离线语音合成的叨逼叨及解决方案
概念 TTS即TextToSpeech，文本转语言，也就是所谓的语音合成技术。TTS技术对文本文件进行实时转换，转...
Node.js结合百度TTS接口实现文字转语音功能
今天工作的时候偶然发现了百度的TTS Restful接口（TTS是TextToSpeech，说白了就是文本转语音的...
编写使用Android 系统自带的文字转语音代码
调用Android系统语音TextToSpeech实例对象具体代码写法如下： TextToSpeech mTex...
Android TTS 语音合成播报
Android TTS 语音合成播报Android系统原生自带了一个TTS引擎。可以自定义TTS引擎，系统默认TT...