摘要: 题目: 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那两个整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案,并且你不能使用两次相同的元素。 可以按任意顺序返回答案。 示例 1: 输入:nums = [2,7,11,15] 阅读全文
posted @ 2025-07-25 14:14 用户snkslakdf 阅读(9) 评论(0) 推荐(0)
摘要: LLama2模型的任务是在 给定 前n个单词的基础上预测句子中下一个单词。该模型的核心特点是其预测过程依赖于过去和当前的输入信息,而不考虑未来的信息。 LLama2是decoder-only transformer的一个具体实现。 阅读全文
posted @ 2025-07-25 10:33 用户snkslakdf 阅读(10) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/1918721629439108231 Self-Attention自注意力机制 核心思想:让模型在处理每个位置的输入时,都可以关注序列中所有位置的信息,并为不同位置分配不同的“注意力”权重。 步骤: 1.输入映射成query,key和val 阅读全文
posted @ 2025-07-25 09:46 用户snkslakdf 阅读(37) 评论(0) 推荐(0)