端到端语音识别博客网站集锦【E2E】

一、Transformer

1.1 【NLP】Transformer详解

1.2 libpytorch的文档: pytorch C++版矩阵运算

1.3 机器学习面试之Attention

1.4 端到端语音识别框架

1.5 动态 Chunk Conformer 在线+离线混合 ASR 模型

1.6 Transformer详解 (矩阵运算讲得比较细致)

1.7 基于Transformer的高效、低延时、流式语音识别模型 (微软和腾讯合作的一篇e2e流式文章介绍)

1.8 https://github.com/xingchensong/speech-recognition-papers (端到端语音识别 几个方向上的paper)

1.9 2022年新一代kaldi团队技术输出盘点  (k2最新技术盘点)

1.10 语音基石模型Speech Foundation Models (语音自监督学习)

 

二、搜索

2.1 Beam Search(集束搜索/束搜索)

2.2 Beam Search 简介

2.3 详细介绍 Beam Search 及其优化方法

2.4 Greedy search与beam search

posted on 2025-08-28 17:40  袁军峰  阅读(12)  评论(0)    收藏  举报

导航