摘要: 先问了下chatgpt: 我正在学习torch.nn.multiheadattention,请告诉我att_mask和key_padding_mask这两个参数有什么不同,分别用于处理什么问题,以及输出有什么不同,并给出代码示例 chatgpt的回答: torch.nn.MultiheadAtten 阅读全文
posted @ 2024-05-21 17:52 waterrr。 阅读(1321) 评论(0) 推荐(0)