随笔档案「2025年5月6日」：第1.3讲、什么是 Attention？——从点菜说起 🍽️ ... - 何双新

2025年5月6日

摘要：假设你在一家餐厅点餐，菜单上有好多菜（句子中的每个单词），你现在要点菜（做决策），但不可能每道菜都吃一样多。你会怎么做？你会：看下菜单（获取所有信息）根据自己的口味打分（我喜欢辣、不要太咸）按照喜好分配注意力（辣子鸡80%，炒青菜20%）最后把你"注意到的内容"组合起来形成最终决策 👉 阅读全文

posted @ 2025-05-06 23:57 何双新阅读(132) 评论(0) 推荐(0)

第1.2讲、从 RNN 到 LSTM 再到 Self-Attention：深度学习中序列建模的演进之路

摘要：处理序列数据（如文本、语音、时间序列）一直是深度学习的重要课题。在这个领域中，我们从 RNN（Recurrent Neural Network）出发，经历了 LSTM（Long Short-Term Memory）的改进，最终发展到了当今大放异彩的 Self-Attention（自注意力机制）。本文阅读全文

posted @ 2025-05-06 13:09 何双新阅读(238) 评论(0) 推荐(0)

且将新火试新茶

公告