我一直在做一个智能会议助手工具的案例,要用到人脸探测和识别,说话人识别,声音识别转文字,然后自动翻译成不同的语言,内容自动提取成为会议记录,最后在Outlook里创建一封邮件,内容就是会议记录,然后所有记录下来的文字作为附件加到邮件里,审阅之后就可以直接发出去了。这就是这个智能会议助手案例的主要功能。
Python学习交流群:1004391443,这里有资源共享,技术解答,还有小编从最基础的Python资料到项目实战的学习资料都有整理,希望能帮助你更了解python,学习python。
要实现这些有意思的功能,就要用到各种技术:
-
人脸探测:已经写过几个人脸探测相关的案例,对我来说没有任何技术实现的难度。
-
人脸识别:在人脸探测基础上应用Dlib开源类库提取人脸特征值,然后自己写了算法来实现人脸识别,识别正确率可以在算法优化基础上继续提高,做演示已经没有问题了。这个人脸识别算法目前是在二维平面上的人脸特征识别,至于更进一步的三维人脸识别算法需要更多时间的研究。
-
说话人识别:我写了一个提取声音特征值的算法来做这个说话人识别,基本演示可以做到。近期准备做一个案例出来。这个算法和人脸识别算法一样,有很大优化提高的空间。
-
声音识别转文字:机器学习算法可以实现,但识别率太低,因此可以使用百度AI服务来做演示,已经做了一个案例。
-
自动翻译:百度AI提供自动翻译功能,今天这个案例就是用百度AI服务来实现这个自动翻译的案例。
-
内容提取:这个是自然语言处理的一个应用案例,已经有了技术实现方式,近期会写一个案例出来。
-
在Outlook里创建一封邮件:这个技术实现此前研究过,可以做到,也准备写一个案例出来。
百度AI开放平台提供的服务很强大了,应用这个平台提供的各种AI服务可以快速实现AI业务功能的开发和实现,也包括了今天要实现的这个自动翻译案例。
运行我写的Python程序调用百度AI的自动翻译服务的案例,整个程序运行过程录下来了,实锤!
程序运行期间保存下来的翻译内容:
[图片上传失败...(image-72a554-1558164647438)]
这个案例的Python程序的源代码已经上传到github,需要的可以直接点击下载(下载前请点个赞,加个星star):
百度AI平台提供的各种人工智能服务还是非常好用的,从学习和研究人工智能的实现效果,或者用来实际处理不是敏感的信息的应用角度而言,实现起来非常简单,测试效果也非常不错。最重要的,很多服务是有免费使用次数的。
网友评论