摘要: 假设你在一家餐厅点餐,菜单上有好多菜(句子中的每个单词),你现在要点菜(做决策),但不可能每道菜都吃一样多。 你会怎么做?你会: 看下菜单(获取所有信息) 根据自己的口味打分(我喜欢辣、不要太咸) 按照喜好分配注意力(辣子鸡80%,炒青菜20%) 最后把你"注意到的内容"组合起来形成最终决策 👉 阅读全文
posted @ 2025-05-06 23:57 何双新 阅读(90) 评论(0) 推荐(0)
摘要: 处理序列数据(如文本、语音、时间序列)一直是深度学习的重要课题。在这个领域中,我们从 RNN(Recurrent Neural Network)出发,经历了 LSTM(Long Short-Term Memory)的改进,最终发展到了当今大放异彩的 Self-Attention(自注意力机制)。本文 阅读全文
posted @ 2025-05-06 13:09 何双新 阅读(148) 评论(0) 推荐(0)