深入解析:【2025年华为秋招(AI)-9月17日-第二题(200分)- 大模型Attention模块开发】(题目+思路+Java&C++&Python解析+在线测试)

题目内容

已知大模型常用的 Attention 模块定义如下:

Y=softmax(QKTh)VY = \text{softmax}\left(\frac{QK^T}{\sqrt{h}}\right)VY=softmax

posted @ 2025-09-18 15:03  yfceshi  阅读(84)  评论(0)    收藏  举报