第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学

作者: 林灿业 | 来源:发表于2019-08-04 23:44 被阅读0次

第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学
第31周+《AI入门系列 - 语音识别基本概念》+林灿业+新学霸
第33周+《AI入门系列 - 语音识别基本概念3》+林灿业+新学
第34周+《AI入门系列 - 语音合成》+林灿业+新学霸社群
C# 基于Accord.Audio和百度语言识别
第30周+《AI入门系列 - 语音交互的模型及概念》+林灿业+新
Python奇技淫巧之利用协程加速百度百科词条爬虫
阅读“百度语音文档”
CMU Sphinx 语音识别入门：语音识别基本概念
第58周+《小白入门学股笔记》+林灿业+新学霸社群

紧接上周笔记，上周笔记写了语音识别基本概念的“语音激活检测”和“语音唤醒”，这周写一写“麦克风阵列”。

一、麦克风阵列定义

百度百科对“麦克风阵列”的定义：

由一定数目的声学传感器（一般是麦克风）组成，用来对声场的空间特性进行采样并处理的系统。

个人理解的定义：一是由麦克风硬件组成，完成对对声音的的拾取，就是机器的“耳朵”；二是由算法软件组成，对拾取到的原声进行处理，保证输出更清晰，信噪比更高的声音，

二、麦克风阵列的作用

1、语音增强

在嘈杂的环境中，所拾取到的声音是由各种各样的声音组成，比如家里的风扇声、脚步声、流水声、小孩玩闹的声音、大人们交谈的声音等～，从这么复杂的声音中提炼出目标信号声，使得声音更纯净，噪音更少。应用在人机交互的语音识别场景中，就是从拾取到的声音中提取出来人的语音，最大化去除非其他的噪音，使得处理后输出的声音最大化保证是人的语音。

PS：一个小问题，多个人同时在讲话的时候，该如何去处理？是否能把多个人的声音分别抽离出来？按每个人的声音做输出？答案时第四点，目标声音的提取与分离技术。

2、声源定位：使用麦克风阵列来计算目标说话人的角度和距离，从而实现对目标说话人的跟踪以及后续的语音定向拾取。

3、去混音：声波在室内传播时，要被墙壁、天花板、地板等障碍物形成反射声，并和直达声形成叠加，这种现象称为混响。

4、目标声音提取与分离：声源信号提取就是从多个声音信号中提取出目标信号，声源信号分离技术则是将需要将多个混合声音全部提取出来。

三、麦克风阵列类型

根据麦克风排列分布情况，可分为“线性麦克风阵列、环形麦克风阵列、球形麦克风阵列”；

根据麦克风数量，可分为双麦麦克风阵列和多麦麦克风阵列。

写这篇文章的时候，突然冒出一个想法，如果说销售是一个市场需求和产品服务相互匹配的过程，那么产品设计是一个科技技术匹配市场需求的过程。

网友评论

新学霸社群

本文标题：第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学

本文链接：https://www.haomeiwen.com/subject/bhpudctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学

一、麦克风阵列定义

二、麦克风阵列的作用

1、语音增强

三、麦克风阵列类型

相关文章