美文网首页
本地部署_语音识别工具_Whisper

本地部署_语音识别工具_Whisper

作者: xieyan0811 | 来源:发表于2023-11-11 18:43 被阅读0次

1 简介

Whisper 是 OpenAI 的语音识别系统(几乎是最先进),它是免费的开源模型,可供本地部署。

2 docker

https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice

3 github

https://github.com/ahmetoner/whisper-asr-webservice

4 运行

nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu

image 大小:11.5G
运行后,即可在9000端口通过swagger调用,我先用手机录了一些简单的中文,识别效果还不错,除了第一次调用时可能是下载和加载模型时间比较长,后面再调用速度就很快。
又用它识别了一个25分钟的mp3(约27M),是一位小哥哥B站视频对应的音频文件,识别时间约为不到1分钟,使用GPU内存占用在1G之内,尽管有一小部分乱码和一些重复,但整体效果不错。
我觉得速度和效果都相当美丽,绝对可以作为一些收费产品的平替了~~

5 注意事项

  • 上传的音频文件使用时尽量不要用中文文件名

相关文章

  • NLP

    本地搜索 文本匹配, 与 文本 转化为 声音 匹配。 与 语音识别翻译 ML:搜索识别, 语音识别,文字识别,图像...

  • 6-2 如何读写json数据

    实际案例: 在web应用中常用JSON格式传输数据,例如我们利用Baidu语音识别服务做语音识别,将本地音频数据p...

  • Android 常见的问题整理 2022

    Android 语音TTS 识别全链路过程 本地录音 =》 ASR识别=》请求后台语义=》语义落域分发返回=》本...

  • 万物皆可 Serverless 之使用云函数 SCF 快速部署验

    验证码识别是搞爬虫实现自动化脚本避不开的一个问题。通常验证码识别程序要么部署在本地,要么部署在服务器端。如果部署在...

  • AlibabaCloudToolkit工具实现一键部署

    配合Alibaba Cloud Toolkit工具自动发布工具实现一键部署! 1. 本地打包后上传文件式部署(np...

  • iOS10初探

    一.新增框架简介 这个是苹果推出的语音识别框架,识别的语音数据保存在苹果服务器上 可以自定义本地推送和远程推送UI...

  • kaldi安装

    kaldi是一个语音识别领域广泛使用的开源工具包,要想入门语音识别,学习kaldi吧 安装前提: 有网 安装步骤:...

  • 智能语音客服服务助手

    智能语音客服服务助手 语音识别 阿里语音识别 百度语音识别 讯飞语音识别 语音合成 阿里语音合成 百度语音合成 讯...

  • 利用sphinx4实现中文命令词识别

    CMU Sphinx CMU Sphinx是一个领先的语音识别工具包,具有用于构建语音应用程序的各种工具。 CMU...

  • 通过Kolla部署工具利用Docker微服务方式安装Openst

    利用kolla部署工具本地仓库部署openstack基础架构: 1.利用docker安装openstack云基础架...

网友评论

      本文标题:本地部署_语音识别工具_Whisper

      本文链接:https://www.haomeiwen.com/subject/ikflwdtx.html