美文网首页新学霸社群
第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学

第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学

作者: 林灿业 | 来源:发表于2019-08-04 23:44 被阅读0次

            紧接上周笔记,上周笔记写了语音识别基本概念的“语音激活检测”和“语音唤醒”,这周写一写“麦克风阵列”。

    一、麦克风阵列定义

            百度百科对“麦克风阵列”的定义:

    由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。

            个人理解的定义:一是由麦克风硬件组成,完成对对声音的的拾取,就是机器的“耳朵”;二是由算法软件组成,对拾取到的原声进行处理,保证输出更清晰,信噪比更高的声音,

    二、麦克风阵列的作用

    1、语音增强 

            在嘈杂的环境中,所拾取到的声音是由各种各样的声音组成,比如家里的风扇声、脚步声、流水声、小孩玩闹的声音、大人们交谈的声音等~,从这么复杂的声音中提炼出目标信号声,使得声音更纯净,噪音更少。应用在人机交互的语音识别场景中,就是从拾取到的声音中提取出来人的语音,最大化去除非其他的噪音,使得处理后输出的声音最大化保证是人的语音。

    PS:一个小问题,多个人同时在讲话的时候,该如何去处理?是否能把多个人的声音分别抽离出来?按每个人的声音做输出?答案时第四点,目标声音的提取与分离技术。

    2、声源定位:使用麦克风阵列来计算目标说话人的角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取。

    3、去混音:声波在室内传播时,要被墙壁、天花板、地板等障碍物形成反射声,并和直达声形成叠加,这种现象称为混响。

    4、目标声音提取与分离:声源信号提取就是从多个声音信号中提取出目标信号,声源信号分离技术则是将需要将多个混合声音全部提取出来。

    三、麦克风阵列类型

    根据麦克风排列分布情况,可分为“线性麦克风阵列、环形麦克风阵列、球形麦克风阵列”;

    根据麦克风数量,可分为双麦麦克风阵列和多麦麦克风阵列。


    写这篇文章的时候,突然冒出一个想法,如果说销售是一个市场需求和产品服务相互匹配的过程,那么产品设计是一个科技技术匹配市场需求的过程。

    相关文章

      网友评论

        本文标题:第32周+《AI入门系列 - 语音识别基本概念2》+林灿业+新学

        本文链接:https://www.haomeiwen.com/subject/bhpudctx.html