上一页 1 2 3 4 5 6 ··· 13 下一页
摘要: 参考视频 GRPO 指的是 Group Relative Policy Optimization(组相对策略优化),最早由 DeepSeek 在 DeepSeekMath 里提出,用来做 LLM 的 RL(尤其是推理/Chain-of-Thought 任务)的高效替代 PPO 的算法。 PPO 需要 阅读全文
posted @ 2025-10-18 13:59 saulstavo 阅读(19) 评论(0) 推荐(0)
摘要: 题目 给你一个下标从 0 开始的整数数组 nums 和一个整数 value 。 在一步操作中,你可以对 nums 中的任一元素加上或减去 value 。 例如,如果 nums = [1,2,3] 且 value = 2 ,你可以选择 nums[0] 减去 value ,得到 nums = [-1,2 阅读全文
posted @ 2025-10-16 13:09 saulstavo 阅读(14) 评论(0) 推荐(0)
摘要: 模运算性质 模运算(modular arithmetic)是数论中的基础工具,尤其常见于算法、密码学、图像处理、哈希函数等领域。它的核心思想是“循环取余”,即我们只关心整数除以某个数后的余数。下面系统地讲讲常见的模运算性质与规律。 更详细,参考:https://leetcode.cn/discuss 阅读全文
posted @ 2025-10-16 12:41 saulstavo 阅读(22) 评论(0) 推荐(0)
摘要: 题目 给你一个由 n 个整数组成的数组 nums 和一个整数 k,请你确定是否存在 两个 相邻 且长度为 k 的 严格递增 子数组。具体来说,需要检查是否存在从下标 a 和 b (a < b) 开始的 两个 子数组,并满足下述全部条件: 这两个子数组 nums[a..a + k - 1] 和 num 阅读全文
posted @ 2025-10-15 21:29 saulstavo 阅读(10) 评论(0) 推荐(0)
摘要: 问题 给你一个由 n 个整数组成的数组 nums ,请你找出 k 的 最大值,使得存在 两个 相邻 且长度为 k 的 严格递增 子数组。具体来说,需要检查是否存在从下标 a 和 b (a < b) 开始的 两个 子数组,并满足下述全部条件: 这两个子数组 nums[a..a + k - 1] 和 n 阅读全文
posted @ 2025-10-15 16:53 saulstavo 阅读(17) 评论(0) 推荐(0)
摘要: 问题 给定一个包含 n + 1 个整数的数组 nums ,其数字都在 [1, n] 范围内(包括 1 和 n),可知至少存在一个重复的整数。 假设 nums 只有 一个重复的整数 ,返回 这个重复的数 。 你设计的解决方案必须 不修改 数组 nums 且只用常量级 O(1) 的额外空间。 示例 1: 阅读全文
posted @ 2025-10-02 20:21 saulstavo 阅读(12) 评论(0) 推荐(0)
摘要: 问题 整数数组的一个 排列 就是将其所有成员以序列或线性顺序排列。 例如,arr = [1,2,3] ,以下这些都可以视作 arr 的排列:[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1] 。 整数数组的 下一个排列 是指其整数的下一个字典序更大的排列。更正式地,如果数组的所有排列根据 阅读全文
posted @ 2025-10-02 17:50 saulstavo 阅读(11) 评论(0) 推荐(0)
摘要: 问题 给定一个包含红色、白色和蓝色、共 n 个元素的数组 nums ,原地 对它们进行排序,使得相同颜色的元素相邻,并按照红色、白色、蓝色顺序排列。 我们使用整数 0、 1 和 2 分别表示红色、白色和蓝色。 必须在不使用库内置的 sort 函数的情况下解决这个问题。 示例 1: 输入:nums = 阅读全文
posted @ 2025-10-02 14:36 saulstavo 阅读(10) 评论(0) 推荐(0)
摘要: 问题 给定一个大小为 n 的数组 nums ,返回其中的多数元素。多数元素是指在数组中出现次数 大于 ⌊ n/2 ⌋ 的元素。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。 示例 1: 输入:nums = [3,2,3] 输出:3 示例 2: 输入:nums = [2,2,1,1,1,2 阅读全文
posted @ 2025-10-02 02:42 saulstavo 阅读(8) 评论(0) 推荐(0)
摘要: 问题 给你一个 非空 整数数组 nums ,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。 你必须设计并实现线性时间复杂度的算法来解决此问题,且该算法只使用常量额外空间。 示例 1 : 输入:nums = [2,2,1] 输出:1 示例 2 : 输入:nums = 阅读全文
posted @ 2025-10-02 01:48 saulstavo 阅读(12) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 13 下一页