iOS文本转语音技术

作者: windgo | 来源:发表于2015-10-04 11:03 被阅读2816次

iOS文本转语音技术
TTS离线语音合成的叨逼叨及解决方案
iOS自带TTS技术的实现即语音播报
iOS语音合成
iOS 文本转语音
ios文本转语音
iOS 文本转语音
AVSpeechSynthesizer 文本合成语音
人工智能产业结构及相关术语
文本转语音

iOS文本转语音技术

其实人就是最牛的TTS

文本转语音技术, 也叫TTS, 是Text To Speech的缩写. iOS如果想做有声书等功能的时候, 会用到这门技术.

iOS7之后才有该功能

需要 AVFoundation 库
AVSpeechSynthesizer: 语音合成器, 可以假想成一个可以说话的人, 是最主要的接口
AVSpeechSynthesisVoice: 可以假想成人的声音
AVSpeechUtterance: 可以假想成要说的一段话

0x000 代码示例, 朗读唐诗静夜思

class TTSExample:AVSpeechSynthesizerDelegate {
let av=AVSpeechSynthesizer()
init(){
av.delegate=self
}
func 朗读静夜思() {
let jingyesi=“静夜思,李白,床前明月光,疑是地上霜,举头望明月,低头思故乡” //标点符号会产生朗读时的停顿, 这样就有节奏了
let utterance=AVSpeechUtterance(string: jingyesi)
utterance.rate=AVSpeechUtteranceDefaultSpeechRate
let voiceType=AVSpeechSynthesisVoice(language: "zh-CN")
utterance.voice=voiceType
av.speakUtterance(utterance)
}
fun 停止朗读(){
av.stopSpeakingAtBoundary(.Immediate)
}
func speechSynthesizer(synthesizer: AVSpeechSynthesizer, didFinishSpeechUtterance utterance: AVSpeechUtterance) {
print(“已经朗读完了”)
//如果想循环播放,可以在这里调用如下代码:
// av.speakUtterance(utterance)
}
}

如果想在后台播放, 需要在配置里设置:

配置后台播放

同时在AppDelegate里启用:

let session=AVAudioSession.sharedInstance()
try! session.setCategory(AVAudioSessionCategoryPlayback)
try! session.setActive(true)

0x01 AVSpeechSynthesizer

这个类就像一个会说话的人, 可以”说话”, 可以”暂停”说话, 可以”继续”说话, 可以判断他当前是否正在说话.有以下的方法或者属性:

说话: speakUtterance
控制: continueSpeaking(继续说), pauseSpeakingAtBoundary(暂停说话), paused(暂停状态的属性), speaking(说话的状态), stopSpeakingAtBoundary(停止说话)
委托: delegate

0x02 AVSpeechBoundary

这是一个枚举. 在暂停, 或者停止说话的时候, 停下的方式用这个枚举标示. 包括两种:

AVSpeechBoundaryImmediate: 立即停
AVSpeechBoundaryWord : 说完一个整词再停

0x03 AVSpeechSynthesizerDelegate

合成器的委托, 对于一些事件, 提供了响应的接口.

didCancelSpeechUtterance: 已经取消说话
didContinueSpeechUtterance: 已经继续说话
didFinishSpeechUtterance: 已经说完
didPauseSpeechUtterance: 已经暂停
didStartSpeechUtterance:已经开始
willSpeakRangeOfSpeechString:将要说某段话

0x04 AVSpeechSynthesisVoice

AVSpeechSynthesisVoice定义了一系列的声音, 主要是不同的语言和地区.

voiceWithLanguage: 根据制定的语言, 获得一个声音.
speechVoices: 获得当前设备支持的声音
currentLanguageCode: 获得当前声音的语言字符串, 比如”ZH-cn”
language: 获得当前的语言

0x05 AVSpeechUtterance

这个类就是一段要说的话. 主要的属性和方法有:

pitchMultiplier: 音高
postUtteranceDelay: 读完一段后的停顿时间
preUtteranceDelay: 读一段话之前的停顿
rate: 读地速度, 系统提供了三个速度: AVSpeechUtteranceMinimumSpeechRate, AVSpeechUtteranceMaximumSpeechRate, AVSpeechUtteranceDefaultSpeechRate
speechString: 要读的字符串
voice: 使用的声音, 是AVSpeechSynthesisVoice对象
volume: 音量

0x06 UML关系图

这些类的关系如下:

TTS类关系图

网友评论

190CM:请问锁屏下播放可以实现吗？我自己试了一下不可以放
LD_左岸:为什么我集成的tts一输入表情或者中文就闪退
liyaoyao:你好，请问你使用这个控制台有没有报copy资源失败的问题，Could not get attribute 'LocalURL': Error Domain=MobileAssetError ？如果没有，能否告诉怎么弄的么？
少年_如他:开了静音了!
海边的1984_:兄弟，有oc版本的吗
画眼线的乞丐:怎么实现音频转文字啊
Scott丶Wang:@画眼线的乞丐 iOS10出的一个Speech框架，可以实现语音转文本

本文标题：iOS文本转语音技术

本文链接：https://www.haomeiwen.com/subject/ltpgcttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

iOS文本转语音技术

iOS文本转语音技术

0x000 代码示例, 朗读唐诗静夜思

0x01 AVSpeechSynthesizer

0x02 AVSpeechBoundary

0x03 AVSpeechSynthesizerDelegate

0x04 AVSpeechSynthesisVoice

0x05 AVSpeechUtterance

0x06 UML关系图

相关文章

iOS文本转语音技术

TTS离线语音合成的叨逼叨及解决方案

iOS自带TTS技术的实现即语音播报

iOS语音合成

iOS 文本转语音

ios文本转语音

iOS 文本转语音

AVSpeechSynthesizer 文本合成语音

人工智能产业结构及相关术语

文本转语音

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

你可不能输！

iOS开发

JC专题