摘要: 根据小红书和牛客网的面经总结。 阅读全文
posted @ 2026-03-02 21:47 MoonOut 阅读(564) 评论(0) 推荐(0)
摘要: 存下来方便查阅。 阅读全文
posted @ 2023-06-16 10:10 MoonOut 阅读(607) 评论(1) 推荐(0)
摘要: 读了 DeepSeek-v3.2 和 v4 的技术报告。 阅读全文
posted @ 2026-05-15 16:46 MoonOut 阅读(33) 评论(0) 推荐(0)
摘要: 还没想好怎么总结。 阅读全文
posted @ 2026-05-15 16:46 MoonOut 阅读(14) 评论(0) 推荐(0)
摘要: 这里应该写这个技术报告的亮点。TBC。 阅读全文
posted @ 2026-05-15 16:40 MoonOut 阅读(11) 评论(0) 推荐(0)
摘要: 2026.05 | 速读文章纪录 阅读全文
posted @ 2026-05-01 18:11 MoonOut 阅读(115) 评论(0) 推荐(0)
摘要: 记录了一下目前安装 claude code 的过程。 阅读全文
posted @ 2026-04-29 23:10 MoonOut 阅读(327) 评论(0) 推荐(0)
摘要: 核心解决方案:从本地下载 vscode 服务器,然后 scp 传到 ubuntu 机器上去,同时降级 Remote - SSH 插件。20260417 补档。 阅读全文
posted @ 2026-04-17 23:24 MoonOut 阅读(231) 评论(0) 推荐(0)
摘要: 总结了 skill discovery 领域的经典工作。 阅读全文
posted @ 2026-04-12 15:25 MoonOut 阅读(189) 评论(0) 推荐(0)
摘要: 整理了 MiroThinker 项目的技术报告和公开资料。 阅读全文
posted @ 2026-04-09 17:18 MoonOut 阅读(266) 评论(0) 推荐(0)
摘要: 阅读了强化学习、推荐系统、CLIP、robotics 等领域的 scaling laws 论文。 阅读全文
posted @ 2026-04-08 15:58 MoonOut 阅读(79) 评论(0) 推荐(0)
摘要: 整理了 12 个 LLM 后训练 / Agent 相关的 GitHub 高 star 项目,涵盖 RL 后训练、多轮交互、search agent、CLI agent 等前沿内容。 阅读全文
posted @ 2026-04-02 15:51 MoonOut 阅读(625) 评论(0) 推荐(0)
摘要: 双指针法也不算很难理解,画一下图就能理解了。 阅读全文
posted @ 2026-03-25 00:25 MoonOut 阅读(49) 评论(0) 推荐(0)
摘要: bfs 爆搜挺好的,打算先学一个 bfs,dfs 以后再看。 阅读全文
posted @ 2026-03-25 00:03 MoonOut 阅读(115) 评论(0) 推荐(0)
摘要: 感觉是经典 dp 问题,前两个贪心,后两个背过好了。 阅读全文
posted @ 2026-03-23 14:33 MoonOut 阅读(94) 评论(0) 推荐(0)
摘要: 中心扩展法:o(n) 遍历所有可能长出回文串的中心位置,o(n) 从中心位置向外拓展回文串。dp:dp[i][j] 表示 s[i:j+1] 是否是回文串,s[i] == s[j] 时 dp[i][j] = dp[i+1][j-1]。 阅读全文
posted @ 2026-03-23 14:05 MoonOut 阅读(188) 评论(0) 推荐(0)
摘要: ① 小于 L 位的数可以随便组成,ans += Σ_{i=1}^{L-1} [D^i];② 对于组成正好 L 位的数,对数位从高到低逐个数考察,如果 s[i] < d[j] 则后面 (L-1-i) 位数字随便选,如果 s[i] == d[j] 则去考察 s[i+1] 看看能否用 d[j'] 匹配上,如果 s[i] > 所有 d[j] 则统计结束。 阅读全文
posted @ 2026-03-23 13:34 MoonOut 阅读(56) 评论(0) 推荐(0)
摘要: 本博客总结了与强化学习、RLHF 相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-21 19:13 MoonOut 阅读(1285) 评论(0) 推荐(0)
摘要: 整理了 focal 等经典 offline meta-RL 工作的 1. offline 数据集收集、2. policy 训练和性能测试的方法。 阅读全文
posted @ 2026-03-19 16:34 MoonOut 阅读(210) 评论(0) 推荐(0)
摘要: 本博客总结了与多模态、主流模型架构相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-18 14:29 MoonOut 阅读(1329) 评论(0) 推荐(0)
摘要: 本博客总结了 LLM 八股面试题中的手撕代码题。 阅读全文
posted @ 2026-03-15 21:57 MoonOut 阅读(1787) 评论(2) 推荐(3)
摘要: 本博客总结了与 LLM 训练流程、微调技术相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-11 23:14 MoonOut 阅读(952) 评论(0) 推荐(0)
摘要: 本博客总结了与 Transformer 相关的 LLM 八股面试题。 阅读全文
posted @ 2026-03-11 16:33 MoonOut 阅读(1503) 评论(0) 推荐(1)
摘要: 根据小红书和牛客网的面经总结。 阅读全文
posted @ 2026-03-11 15:12 MoonOut 阅读(2527) 评论(0) 推荐(0)
摘要: 复习一下经典 dp 模型 背包问题。 阅读全文
posted @ 2026-03-10 20:08 MoonOut 阅读(122) 评论(0) 推荐(0)
摘要: 感觉状态机的思路是最直观的。 阅读全文
posted @ 2026-03-10 18:57 MoonOut 阅读(25) 评论(0) 推荐(0)
摘要: 这个题使用桶排序思想:维护一个长度为 MAX_OCCUR_COUNT 的数组 buckets,buckets[i] = c 代表元素 c 出现 i 次。 阅读全文
posted @ 2026-03-10 16:29 MoonOut 阅读(23) 评论(0) 推荐(0)
摘要: 这个题不需要用到并查集;o(m×n) 复杂度遍历整个地图,使用 bfs 把所有岛屿“淹没”,就可以了。 阅读全文
posted @ 2026-03-10 15:00 MoonOut 阅读(90) 评论(0) 推荐(0)
摘要: 如果二叉树维护了父节点,则寻找最小公共祖先可以使用时间复杂度 o(H)、空间复杂度 o(1) 的双指针法,利用路径相等的原理,非常巧妙。 阅读全文
posted @ 2026-03-10 14:19 MoonOut 阅读(50) 评论(0) 推荐(0)
摘要: 经典二叉树递归题。如果 node == p 或 q 或 None,返回 node;然后,left, right = dfs(左子树) (右子树);如果 left 或 right 有值,证明 p 或 q 被找到了,返回有值的那个;如果 left right 都有值,则 p q 分别为 left right,return node。 阅读全文
posted @ 2026-03-10 14:08 MoonOut 阅读(178) 评论(0) 推荐(0)
摘要: 递归调用函数,对一个“根节点-左节点-右节点”结构的情况进行枚举:1. 路径为“根节点→左节点或右节点→它的子节点”;2. 路径为“左节点的子节点→左节点→根节点→右节点→右节点的子节点”。 阅读全文
posted @ 2026-03-10 13:43 MoonOut 阅读(75) 评论(0) 推荐(0)
摘要: 使用拒绝采样,构造 7×7 = 49 大小的空间,然后只使用 1-40。 阅读全文
posted @ 2026-03-04 14:19 MoonOut 阅读(213) 评论(0) 推荐(2)
摘要: 感觉是简单最小堆题目,不知道为啥 leetcode 评级是 hard。以及,因为 python list 排序很快,所以也可直接把链表上所有元素拿下来,排序,再构建全新链表。 阅读全文
posted @ 2026-03-03 23:21 MoonOut 阅读(62) 评论(0) 推荐(0)
摘要: 利用数组 1 末尾的空闲空间,使用从后向前的双指针,遍历数组 1 2 。 阅读全文
posted @ 2026-03-03 23:04 MoonOut 阅读(98) 评论(0) 推荐(0)
摘要: 二分查找:第 K 小的元素是多大呢?在有序矩阵中,给定一个数值,只需要 o(n) 复杂度,就可以得到 ≤ 它的元素的数量。因此,时间复杂度为 二分的 o(log 值域大小) × 查找的 o(n)。 阅读全文
posted @ 2026-03-03 23:00 MoonOut 阅读(101) 评论(0) 推荐(0)
摘要: 经典的 o(n) 做法,是通过类似快排的 partition pivot 操作,递归寻找第 k 大的数;然而思路四更加简洁优雅,时间复杂度也是 o(n) 的。 阅读全文
posted @ 2026-03-03 22:37 MoonOut 阅读(204) 评论(0) 推荐(0)
摘要: 先排序,然后固定数字 1,双指针法搜索数字 2 3,注意要把重复的数字 2 3 去除。 阅读全文
posted @ 2026-03-03 17:04 MoonOut 阅读(140) 评论(0) 推荐(0)
摘要: 使用 python 的 dict 存储 "字符: 出现位置" 的映射。 阅读全文
posted @ 2026-03-03 16:49 MoonOut 阅读(186) 评论(0) 推荐(0)
摘要: 第一次用 python 写记忆化搜索,用 dict 写起来很方便,思路也很清晰。 阅读全文
posted @ 2026-03-03 15:26 MoonOut 阅读(35) 评论(0) 推荐(0)
摘要: 如果认为判断一个 word 是否在 set 里是 o(1) 的,则 dp 方法的时间复杂度是 o(n²)。不过,集合判断操作的时间复杂度实际是 o(n) 的,所以总时间复杂度是 o(n³)。 阅读全文
posted @ 2026-03-03 15:17 MoonOut 阅读(40) 评论(0) 推荐(0)
摘要: 又一个 dp 基础题。 阅读全文
posted @ 2026-03-03 15:08 MoonOut 阅读(59) 评论(0) 推荐(0)
摘要: 这一题比上一题(1143)更简单,使用 dp 可以轻松解决。滑动窗口匹配法的空间复杂度更低,但时间复杂度略高。 阅读全文
posted @ 2026-03-03 11:26 MoonOut 阅读(33) 评论(0) 推荐(0)