a.简述
简单来说就是将图片中的文字获取下来,然后再转变成语音的格式朗读出来,整个过程我们只需要调用百度的包就好了(哈哈哈哈哈哈~调包永远是最爽的!!)
b.然后我们干嘛呢???
-
进入pycharm,在命令行输入pip install baidu-aip 来安装包(一般都是python3.6的环境)
-
然后我们进入百度云的管理中心里的人工智能选项,先点 文字识别 创建一个应用,然后点击 百度语音 创建一个应用!
-
记录两个应用中的三个参数设置,在这里:
百度语音应用 -
创建config.py文件来放这些参数
c.接下来
接下来就是代码环节了,话不多说,上图:
01-代码
02-代码
图片我用的是本地文件,如果是网络图片,那用的方法也不一样,可以参考官方文档!
d.最终
-
输出mp3格式的一段语音文件(代码定义~)
测试
文字识别接口文档链接:https://cloud.baidu.com/doc/OCR/OCR-Python-SDK/24.5C.E6.8E.A5.E5.8F.A3.E8.AF.B4.E6.98.8E.html
百度合成语音接口文档链接:https://cloud.baidu.com/doc/SPEECH/TTS-Online-Python-SDK/24.5C.E6.8E.A5.E5.8F.A3.E8.AF.B4.E6.98.8E.html
网友评论