摘要:
假设你在一家餐厅点餐,菜单上有好多菜(句子中的每个单词),你现在要点菜(做决策),但不可能每道菜都吃一样多。 你会怎么做?你会: 看下菜单(获取所有信息) 根据自己的口味打分(我喜欢辣、不要太咸) 按照喜好分配注意力(辣子鸡80%,炒青菜20%) 最后把你"注意到的内容"组合起来形成最终决策 👉 阅读全文
posted @ 2025-05-06 23:57
何双新
阅读(90)
评论(0)
推荐(0)
摘要:
处理序列数据(如文本、语音、时间序列)一直是深度学习的重要课题。在这个领域中,我们从 RNN(Recurrent Neural Network)出发,经历了 LSTM(Long Short-Term Memory)的改进,最终发展到了当今大放异彩的 Self-Attention(自注意力机制)。本文 阅读全文
posted @ 2025-05-06 13:09
何双新
阅读(148)
评论(0)
推荐(0)

浙公网安备 33010602011771号