2025 年 2月 8 日随笔档案 - lyu6

2025年2月8日

摘要： Whisper 是一种通用的语音识别模型。它基于各种音频的大型数据集进行训练，也是一种多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 Transformer 序列到序列模型针对各种语音处理任务进行训练，包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为解码器要预测的令阅读全文

posted @ 2025-02-08 10:42 lyu6 阅读(651) 评论(0) 推荐(0)

lyu_blog

公告