使用gradio实现实时语音识别

这里通过gradio来实现实时语音识别,通过上传一个文件,当点击提交后则在右侧输出其相应识别的文字。
实现代码比较简单,如下所示:

import gradio

def convert(file_bytes):
    # 语音识别方法,其中file_bytes是采样率与对应numpy.ndarray实例
	return recognition_func(file_bytes[1])

demo = gradio.Interface(fn=convert,inputs=gradio.Audio(),outputs="textbox")
demo.launch()

其效果如下:
image

可以看到效果还是可以的。不仅支持识别还把标点符号给添加了。

posted @ 2025-03-19 21:33  月薪几千的牛马  阅读(172)  评论(0)    收藏  举报