摘要: 我会不时上传一些自己的笔记,如果有理解错误的地方请在评论区指出,我会及时回复的! 如果我的笔记有帮助到你的话,可以动动小手登录一下,你的点赞评论和关注是我持续更新的动力!(成就感↑↑↑) 阅读全文
posted @ 2025-03-07 21:49 绵满 阅读(297) 评论(0) 推荐(1)
摘要: 背景 在工业推荐系统中,特征通常被表示为高维稀疏的 One-Hot 向量,随后通过嵌入层映射为稠密向量。这种“参数化查表”的方式面临两个核心矛盾: 嵌入表的内存爆炸:随着物品和用户规模激增,完整的嵌入表(Embedding Table)会占用数百 GB 甚至 TB 级显存,远超单机容量,迫使系统采用 阅读全文
posted @ 2026-05-21 18:11 绵满 阅读(76) 评论(0) 推荐(0)
摘要: 美团精排 Scaling 的工作 SIF,目前挂在 Arxiv 26.04 上,提出了将历史序列 token 从 item-level 升级到 sample-level 的新思路,实现了更强的信息利用和模型效果 背景 推荐系统精排模型的 Scaling 主要分为两种(这两种不是分开独立的,后者是前者 阅读全文
posted @ 2026-05-20 21:24 绵满 阅读(62) 评论(0) 推荐(0)
摘要: 字节跳动精排 Scaling 的工作 Mixformer(和 HyFormer 算是同期工作吧),目前挂在 Arxiv 26.02 上,也是提出了一个新的架构实现更好的统一 Scaling 背景 现有序列建模和特征交叉的工作主要分为分离式和统一式,分离式的设计限制了双向信息流和延迟优化,统一式的 O 阅读全文
posted @ 2026-05-14 18:55 绵满 阅读(109) 评论(0) 推荐(0)
摘要: 字节跳动精排 Scaling 的工作 HyFormer,发表于 SIGIR 2026,设计全新的针对性优化架构同时完成序列建模和特征交叉,而不是直接将 Transformer 拿来用,实现了更好的优化和 Scaling 背景 传统推荐精排模型有两个非常重要的子模块,序列建模和特征交叉,这两个子模块一 阅读全文
posted @ 2026-05-12 17:01 绵满 阅读(165) 评论(0) 推荐(0)
摘要: 字节跳动精排 Scaling 的工作 OneTrans,发表于 WWW 2026,用一个统一的 Transformer Backbone 完成序列建模和特征交互的开创性工作,支持了统一的 Ranking LLM 优化和 Scaling 背景 工业推荐系统的排序模型,长期以来沿用一种固定的两阶段范式: 阅读全文
posted @ 2026-05-10 12:43 绵满 阅读(146) 评论(0) 推荐(0)
摘要: 快手视频观时预测的工作 CREAD,发表于 AAAI 2024,深入分析了分桶策略,在理论上是一篇很棒的工作 背景 观看时长预测本质上是个回归问题,但它的标签分布通常极其长尾:大量样本集中在很短的时长(比如 3 秒内占 30%),而长时长的样本非常稀疏。这种不平衡性让直接做回归很难,模型容易被头部样 阅读全文
posted @ 2026-05-09 10:52 绵满 阅读(86) 评论(0) 推荐(1)
摘要: 谷歌非常经典的一篇 LTV 预测的工作 ZILN Loss,挂在了 Arxiv 上并未发表,用一个混合损失解决大量零值和高偏态连续值的数据分布问题 背景 现有 LTV 预测工作主要分为两种:一种是直接基于 MSE 建模 LTV;一种是两阶段建模,先用 BCE 建模付费概率,然后用 MSE 建模付费金 阅读全文
posted @ 2026-05-08 16:13 绵满 阅读(84) 评论(0) 推荐(0)
摘要: 小红书视频观时预测的工作 EGMN,发表于 Recsys 2025 并且拿到了 Best Paper Candidate,确实是理论上很出色的工作,但是在数据及其长尾的情况下实用性存疑(实验发现高斯分量会因为大量的快滑样本而坍缩,学不到尾部的多峰分布) 背景 观看时长预测本质是一个回归问题,由于时长 阅读全文
posted @ 2026-05-05 14:57 绵满 阅读(36) 评论(0) 推荐(0)
摘要: 快手视频观时预测的工作 D2Q,发表于 KDD 2022,用直观有效的分桶方式解决观时预测的 duration bias,这么多年了依旧是线上最能打的工作 背景 观看时长(watch time)是视频推荐中的重要指标之一,提升整体观看时长是视频推荐系统的主要目标。观看时长主要受两个因素的影响:用户是 阅读全文
posted @ 2026-05-05 14:46 绵满 阅读(81) 评论(0) 推荐(0)
摘要: 背景 Agent 系统的性能越来越依赖 Harness,但这些逻辑通常藏在代码里、框架默认设置里,或者特定运行时的各种约定里。结果就是很难把一个 Harness 移植到另一个系统、拿来比较,或者系统性地研究改进 作者提出把 Harness 的高层控制逻辑从代码中抽出来,用自然语言写成一个可编辑、可移 阅读全文
posted @ 2026-04-06 21:53 绵满 阅读(165) 评论(0) 推荐(0)
摘要: 背景 作为模型外面的那层运行框架,Harness 的优化至关重要,但与现有各种文本优化的方法不同,Harness 是一个复杂的带状态的外层程序 最近虽然涌现了一些“文本优化器”(如 OPRO, TextGrad, GEPA 等),试图利用 LLM 来迭代改进 Prompt 或代码,但它们在 Harn 阅读全文
posted @ 2026-04-06 17:14 绵满 阅读(158) 评论(0) 推荐(0)
摘要: 背景 现有的 memory 工作主要都关注 Agent 独立利用自身存储的记忆来完成任务,这种孤立的范式忽视了 Agents 间的互动和集体记忆的巨大潜力。当前方法常常未能模拟复杂多代理环境中自然发生的异步对话和知识交流,忽视了拥有独特对话历史和专业培训的 Agents 之间的固有多样性和互补性 因 阅读全文
posted @ 2026-03-29 12:36 绵满 阅读(103) 评论(0) 推荐(1)
摘要: 背景 智能体记忆如今极其碎片化,研究人员们发现,当大家谈论智能体记忆时,所指的可能完全是不同的事物:有人专注于存储用户对话历史,有人研究如何从失败中提炼策略,还有人试图将知识直接烙进模型参数里。同时,大量新兴术语(如陈述性记忆、情景记忆、参数记忆等)的涌现,进一步模糊了概念的清晰度 因此,这篇综述直 阅读全文
posted @ 2026-03-22 21:52 绵满 阅读(77) 评论(0) 推荐(0)
摘要: 多维动态规划 (1) 不同路径 """ 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。问总共有多少条不同的路径? """ dp = [[1] * n fo 阅读全文
posted @ 2026-03-14 18:24 绵满 阅读(23) 评论(0) 推荐(0)
摘要: 贪心 (1) 买卖股票的最佳时机 """ 给定一个数组 prices, 它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。你只能选择某一天买入这只股票,并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。 """ res = 0 min_pric 阅读全文
posted @ 2026-03-14 18:23 绵满 阅读(14) 评论(0) 推荐(0)