人工智能训练线上算力实验环境
语音识别,转文字。
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
inference_pipeline = pipeline(
task=Tasks.auto_speech_recognition,
model='iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch',
model_revision="v2.0.4")
rec_result = inference_pipeline('https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_vad_punc_example.wav')
print(rec_result)
ModelScope 提供的语音识别模型。
-
modelscope.pipelines.pipeline:这是 ModelScope 提供的一个接口,用于加载和运行预训练模型的推理管道(pipeline)。它简化了模型加载、预处理、推理和后处理的步骤。 -
modelscope.utils.constant.Tasks:这是一个包含各种任务类型的枚举类,用于指定当前任务的类型。在这里,任务类型是语音识别(auto_speech_recognition)。
-
pipeline:创建一个推理管道实例。-
task:指定任务类型为语音识别(auto_speech_recognition)。 -
model:指定使用的模型。这里使用的是iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch,这是一个针对中文语音识别的预训练模型,支持语音活动检测(VAD)、标点预测等功能。 -
model_revision:指定模型的版本号,这里是v2.0.4。
-
-
inference_pipeline:调用推理管道实例,传入音频文件的 URL。 -
rec_result:存储推理结果,即语音识别的结果。
代码的功能
这段代码的功能是通过 ModelScope 提供的语音识别模型,将指定 URL 中的音频文件进行语音识别,并输出识别结果。
关于链接解析问题
你提到的链接解析问题可能是由于以下原因之一导致的:
-
链接格式问题:代码中的 URL 格式可能存在问题。例如,URL 中包含了多余的 HTML 标签(如
<url>),这可能导致解析失败。 -
网络问题:可能是网络连接不稳定或无法访问指定的服务器。
-
资源不可用:指定的音频文件可能不存在或服务器无法提供该资源。
解决建议
-
检查链接格式:确保 URL 是一个有效的音频文件链接,例如:
-
去掉多余的 HTML 标签,直接传入音频文件的 URL。
-
检查网络连接:确保你的网络可以正常访问上述链接,可以尝试在浏览器中直接打开该链接,看是否能成功下载音频文件。
-
检查资源可用性:确认音频文件在服务器上是可用的。如果链接无效或文件不存在,需要更换一个有效的音频文件链接。
-
重试:如果上述步骤都确认无误,但仍然无法解析,可以尝试重新运行代码。

[{'key': 'asr_vad_punc_example', 'text': '正是因为存在绝对正义,所以我们接受现实的相对正义。
|
|
结果结构解析JSON复制
|
