语音识别:
- 概念:以语音为研究对象,通过特征提取和模式匹配等技术手段让机器自动识别人类的语言。
- 流程:声音的输入--->信号预处理(降噪、回声消除等)--->特征提取(只关注对识别文字有用信息如音调、说出的话的字数)--->模式匹配(声学模型|语言模型)
比较典型的一个模式匹配模型是HMM模型(隐马尔科夫链模型),说到底还是计算一个概率问题。
HMM浅析
语音合成:
- 概念:将文本状态的文字信息转化为可听的声音信息。
- 流程:文本信息的输入--->语言处理(根据词典规则)--->音律处理--->语音单元的拼接(依据语音库)--->语音输出
语音库的产生:收集需求(需要的某种声音)--->试音--->效果确认--->音库生产线--->语音库
网友评论