摘要: Transformer 是一种用于 自然语言处理(NLP)和深度学习 的神经网络架构,最早由 Google 研究团队在 2017 年的论文 “Attention Is All You Need” 中提出。它彻底改变了 NLP 领域,并成为现代大模型(如 GPT、BERT、DeepSeek 等)的基础 阅读全文
posted @ 2025-02-20 18:59 matengfei 阅读(71) 评论(0) 推荐(0)