科大讯飞SDK接口介绍

科大讯飞SDK接口介绍

作者: CokeNello | 来源:发表于2016-11-06 11:03 被阅读1021次

科大讯飞SDK接口介绍
[XUnity]:Unity与Android Studio 结合
ios中基于科大讯飞SDK进行人脸装扮
科大讯飞语音听写接口使用的封装
科大讯飞简单的语音识别
科大讯飞：介绍2022年冬奥会体育项目的H5
科大讯飞SDK使用
flutter-科大讯飞AIUI-iOS端集成
讯飞语音识别
1.iOS app引入Containers.framework

1 .概述

萌萌哒皮卡丘

如今，机器人崛起，而语音正是机器人的一个必要的技能，想想如果一个机器人听不懂人说的话，那它只能是机器，而不能冠以“人”之名。
科大讯飞，想必是现在最火的一家公司之一吧，其拥有好几年的技术经验的积累，观望以前，技术的不成熟：神经网络算法的不成熟，硬件上的瓶颈，等等，这些，都让从前的科大讯飞吃尽了苦头。但是，现在却不同了，随着硬件上关键的突破，软件上的突破，机器学习，语音分析的成熟，再加上这些年来的技术积累以及数据的沉淀，科大讯飞也就迎来了她的春天。

2 .语音听写

语音听写

语音听写，主要是将连续的语音快速识别为文字的过程。这是一个非常有用的接口，它让机器人实现了听懂人的话。而，更加人性化的是，开发者可以针对某一个应用，根据特定场景下的用词，按照格式上传一些高频的词语，让科大的分析引擎通过机器学习，从而对这些词语有着更高的识别率。
而且，科大官方也提出了几个听写的模型，通俗理解就是一些场景，针对这些场景，某些词语的识别率更高。

3.命令词识别

命令词识别

在线命令词识别的语法文件根据作用范围不同，又分为应用级在线语法文件和终端级在线语法文件。
应用级在线语法文件，即语法文件绑定 Appid。应用级在线语法文件需在讯飞开放平台页面进行设置，一旦设置成功，不同设备上的同一应用将默认启用此在线语法。具备统一管理语法，语法更新无需更新客户端 App 的优点。
终端级在线语法文件，则是语法文件绑定某一终端，通过 App 先本地构建语法文件，再上传该语法文件获取相应的ID即 Grammar ID，然后在使用识别功能前指定 Grammar ID 以启用该语法文件。
在线命令词识别默认启用应用级在线语法文件。如果又指定了终端级语法文件的 Grammar ID，那么两种类型的语法文件同时生效，无优先级顺序，最终识别结果按照结果置信度降序返回。

命令词，诸如：芝麻开灯，芝麻关灯等等，然后去做一个识别。
而这个接口可以集成为在线也可以为本地。

4.语音合成

语音合成

与语音听写相反，合成是将文字信息转化为可听的声音信息，让机器像人一样开口说话。
语音合成能配置很多东西：如，发音人（男童？女孩？大妈？大叔？），语言（英语，中文）等等。
同样，这个接口可以集成为在线也可以为本地。

5.语义理解

语义理解

如果说，语音听写接口是一名翻译者，那么语义理解就是一名交流者。翻译者只是纯粹的翻译，而不加个人的感情，而交流者，却是专心的理解你的话，恰到好处地回答你的问题，解答您的困扰。
语义理解就是这个样子，开发者通过构建自己的语义库（其实就是一问一答），能让机器人开始理解人类。
此接口支持文本的语义理解和语音的语义理解。但是不支持离线。

6.语音评测

语音评测

语音评测是通过智能语音技术自动对发音水平进行评价、发音错误、缺陷定位和问题分析的软件系统。
同过设置，可以设置为评测英文，中文。

7.声纹识别

声纹识别

声纹识别（Voiceprint Recognize），是一项根据语音波形反映说话人生理和行为特征的语音参数，自动识别说话人身份的技术。声纹识别所提供的安全性可与其他生物识别技术（指纹、掌形和虹膜）相媲美，且只需要电话和麦克风即可，数据采集极为方便，造价低廉，是最为经济、可靠、简便和安全的身份识别方式。

8.其他

人脸识别，楼主没使用过，楼主倒是用过Face++的，还挺可以的，收费版应该更好。
语音唤醒，收费级别的接口，没用过。

相关文章

科大讯飞SDK接口介绍
1 .概述如今，机器人崛起，而语音正是机器人的一个必要的技能，想想如果一个机器人听不懂人说的话，那它只能是机器，...
[XUnity]:Unity与Android Studio 结合
SDK_科大讯飞_AndroidStudio
ios中基于科大讯飞SDK进行人脸装扮
Demo下载地址大致介绍导入科大讯飞库采用科大讯飞人脸识别技术SDK 抓取照相机预览层的帧数据创建一个Vi...
科大讯飞语音听写接口使用的封装
在科大讯飞开放平台——语音听写接口的使用这篇文章里介绍了科大讯飞语音听写接口的简单使用方法，但是在实际开发中发现仅...
科大讯飞简单的语音识别
最近需要做一个语言搜索的功能，所以需要用到语言识别的SDK，最终选择科大讯飞的SDK. 科大讯飞APPkey的获取...
科大讯飞：介绍2022年冬奥会体育项目的H5
案例：下雪了！品牌：科大讯飞技术实现： jQuery + ThreeJS + 科大讯飞语音接口亮点： 1、创...
科大讯飞SDK使用
有UI识别IFlySpeechRecognizerView 无UI识别IFlySpeechRecognizer 语...
flutter-科大讯飞AIUI-iOS端集成
科大讯飞https://doc.iflyos.cn/aiui/sdk/mobile_doc/quick_start...
讯飞语音识别
语音识别，科大讯飞提供了sdk和web api，相比于sdk还要下载安装，web api显然clean很多，只要直...
1.iOS app引入Containers.framework
说明：1.本app支持的最低系统是iOS 8.0，2.引入科大讯飞SDK，该SDK中引入了Containers.f...

网友评论

WS_0909:请问你的声纹识别能给个Demo吗
CokeNello:额，那是很久之前的Demo了，你去看看官方的文档吧，不难理解的。
鹿小:这些需要付费吗？
鹿小: @栗子酱plus 你现在是基于此二次开发吗？
鹿小: @栗子酱plus 谢谢呀
CokeNello: @鹿小印象中好像不用收费。

本文标题：科大讯飞SDK接口介绍

本文链接：https://www.haomeiwen.com/subject/mloguttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

机器学习与数据挖掘

热点阅读

Android随笔

机器学习与数据挖掘

关于我们|服务条款|联系我们|科大讯飞SDK接口介绍|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！