一、什么是声纹识别?
声纹识别,也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。
二、什么是声纹采集?
声纹识别系统通过采集语音,提取声纹特征,训练模型并建立声纹模型库,把待识别的语音和声纹模型库进行比对,从而实现对说话人的识别。声纹识别系统一般包括两个步骤:声纹建模和声纹验证,典型的声纹识别系统如下图所示。声纹建模过程中涉及到的语音文件采集就是所谓的声纹采集。
三、标准声纹采集终端的必要性
在声纹识别的过程中,建立庞大有效的声纹数据库并对数据进行精确标注就成了基础且重要的一环。但在实际的声纹采集过程中,由于不同的设备、不同的信道等等的差异,声纹数据库质量往往参差不齐,这些质量问题往往会影响算法模型的建立,从而导致识别准确率的降低。
为了确保入库声纹的质量,就需要通过科学、系统的研究来制定针对自然人的声纹信息标准采集流程,同时研制标准声纹采集终端,建立可操作的标准声纹采集流程,为声纹库建设提供标准支撑,也确保采集入库的各个声纹能够发挥应有的价值。
标准声纹采集终端应该特别注重以下几个方面:
1.有效克服信道差异对识别结果的干扰,比如采用多通道同时录音的方式提高声纹采集精度,且多个信道的组合能够有效覆盖目前各种主流信道;
2.充分考虑声纹信息采集内容的完整性;
3.采集过程要有明确的可操作性。
通过标准声纹采集终端,就可以采集到符合各类声纹建库要求的高质量声纹数据要求,为声纹识别、声纹鉴定和比对提供坚实的基础。
国内目前有不少公司在研发标准声纹采集终端,由快商通推出的 BioVoice 2.0 标准声纹采集终端正是专门为标准声纹采集场景研发的声纹采集终端,采用智能化麦克风集群,支持单向/全向拾音、多种文本采集方式。配套集采集、多标签入库、分类存储、实时检索功能于一体智能化声纹采集系统,可连续性创建采集,批量入库,缩短多人采集入库时间成本,保证声纹信息采集内容的完整性和真实性,提高声纹采集的质量和效率。一次语音录入即可采集到符合公安机关声纹建库要求的高质量声纹数据,为声纹鉴定和比对提供坚实的基础。
快商通 BioVoice 2.0 标准声纹采集终端满足公安部《声纹数据采集终端技术要求》。对接快商通智能声纹识别引擎、智能声纹鉴定专家工作站等,可以轻松实现声纹识别1:1身份确认、声纹识别1:N嫌疑人排查、声纹辨认等功能。同时可以进行实时比对和声纹鉴定。仅凭一通电话录音或微信语音即可快速确定嫌疑人和缩小侦查范围。
公共安全作为与人们生命财产安全紧密相关的重要领域,在人工智能的助推下,迎来了一轮技术革新,相关智能化应用涌现。基于生物特征的身份识别认证技术为侦破案件提供了强有力的帮助。经国务院同意印发的《“十三五”国家战略性新兴产业发展规划》中,声纹识别更是被重点列入“推广期”。
快商通深耕人工智能技术研发九年,以踏实严谨的科研实践能力,不断被权威机构肯定,众多经过严格检验的产品组成了快商通实用性与创新性双优口碑的产品矩阵,同时时刻以推动声纹等人工智能应用落地、推动各行业规范有序发展为己任,奠定了公司在声纹应用领域的领先地位!
2018年11月,快商通参与公安部牵头起草的《安全防范声纹识别应用程序接口规范》和《安全防范声纹识别应用网络语音样本技术要求》两项声纹技术方面的国家标准;2019年1月,与中国标准化院共建国内首个“声纹识别技术标准化研究基地”和“自然语言处理技术应用标准化研究基地”,启动司法鉴定领域团体标准的制定工作,并作为中标院唯一辅导单位,正式申报“声纹识别与自然语言处理技术”国际标准。
声纹识别等人工智能技术正在进入大规模实用阶段,只有兼具优良品质和创新价值的AI产品,才能真正助力智慧警务升级。作为行业领头羊,快商通未来将持续精准匹配公安需求,不断提升产品性能,致力于公共安全等垂直行业的应用落地,为智慧警务建设贡献力量。
网友评论