摘要: 看一遍就懂-大模型架构及encoder-decoder详细训练和推理计算过程 一、特殊Token的意思 不同模型架构的特殊token体系 BERT(Encoder-only,用于理解任务): <CLS>:放在句首,用于分类任务,其输出向量代表整句语义 <SEP>:分隔符,用于句对任务(如问答、文本蕴 阅读全文
posted @ 2026-01-25 18:21 石头开会 阅读(698) 评论(0) 推荐(0)
摘要: 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践 原文:https://arxiv.org/pdf/2508.12665 一、引言:问题背景与研究动机 在短视频推荐系统中,观看时长(Watch Time)被广泛视为衡量用户满意度与内容质量的核心信号之一。与点击、点赞等离散反馈不同 阅读全文
posted @ 2025-12-29 17:56 石头开会 阅读(835) 评论(0) 推荐(0)
摘要: 从负反馈中学习并衡量序列推荐系统的响应能力 Google RecSys’23 —Learning from Negative User Feedback and Measuring Responsiveness for Sequential Recommenders 一、问题背景与研究动机 在工业级 阅读全文
posted @ 2025-12-24 15:04 石头开会 阅读(709) 评论(0) 推荐(0)
摘要: 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术 引言 近年来,大规模推荐系统正经历一场深刻的范式演进,其趋势是从传统的双塔召回模型(Dual-Encoder + ANN)向更为灵活和强大的生成式检索(Generative Retrieval)范式迁移。后者借鉴了自然语言处理领域的成功经验 阅读全文
posted @ 2025-09-16 16:10 石头开会 阅读(6496) 评论(2) 推荐(2)
摘要: 注意力机制:从核心原理到前沿应用 注意力机制:从核心原理到前沿应用 如果你关注人工智能,无论是惊艳世人的GPT-4,还是精准洞察你购物偏好的推荐引擎,它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。 然而,随着技术飞速发展,Attention的“家族”也日益庞大:Self-Attentio 阅读全文
posted @ 2025-09-15 10:17 石头开会 阅读(930) 评论(0) 推荐(2)
摘要: ![image](https://img2024.cnblogs.com/blog/3670197/202604/3670197-20260401113941476-1105799487.png) 阅读全文
posted @ 2026-04-01 11:40 石头开会 阅读(178) 评论(2) 推荐(0)
摘要: AUC 与 GAUC:从全局排序到用户内排序的理解 AUC 与 GAUC:从全局排序到用户内排序的理解 一、为什么需要 AUC 评估一个推荐模型,最直觉的想法是看准确率——预测对了多少条。但准确率有一个致命缺陷:它高度依赖正负样本的比例。在推荐场景中,用户点击的内容往往只占曝光内容的百分之几,样本极度不平衡,一个把所有样本都预测为"不点击"的模型,准 阅读全文
posted @ 2026-03-17 11:46 石头开会 阅读(185) 评论(0) 推荐(1)
摘要: 推荐系统中 Q 值的设计:从训练目标到推理信号 推荐系统中 Q 值的设计:从训练目标到推理信号 一、为什么要聊这个话题 做推荐系统的人,每天都在和 Q 值打交道。粗排要输出 Q 值,精排要融合多个 Q 值,线上打分公式里全是 Q 值。但如果你问"这个 Q 值到底代表什么,为什么可以用它来排序",很多人的回答是"模型输出的分数呗"——这个回答没有错 阅读全文
posted @ 2026-03-15 11:06 石头开会 阅读(112) 评论(0) 推荐(1)
摘要: OneTrans解读:统一序列建模与特征交互 一、问题背景:为什么要打破两段式 Pipeline 工业推荐系统的排序模型,长期以来沿用一种固定范式:先用序列模块(如 DIN、Transformer)对用户行为历史进行编码,得到压缩的用户兴趣表示;再将其与用户画像、物品特征、上下文特征拼接,送入特征交 阅读全文
posted @ 2026-03-14 14:15 石头开会 阅读(363) 评论(0) 推荐(0)
摘要: RankMixer:在工业级推荐系统中扩展排序模型 摘要 近年来,大语言模型(LLMs)的快速发展激发了将推荐系统进行大规模扩展的研究兴趣,但在工业实践中仍面临两项关键挑战。第一,工业级推荐系统在训练和在线推理阶段必须满足严格的时延约束和高并发(QPS)需求,计算与服务成本受到强约束。第二,现有排序 阅读全文
posted @ 2026-02-21 12:19 石头开会 阅读(624) 评论(0) 推荐(1)
摘要: OneTrans:在工业级推荐系统中以单一 Transformer 实现特征交互与序列建模的统一框架 摘要 在推荐系统中,扩展特征交互模块(例如 Wukong、RankMixer)或用户行为序列模块(例如 LONGER)已经取得了显著成果。然而,这两类工作通常沿着彼此独立的路径推进,这不仅阻碍了双向 阅读全文
posted @ 2026-02-14 11:31 石头开会 阅读(577) 评论(0) 推荐(0)
摘要: GitHub Pages 技术文档站点搭建实践指南 1. 开发者的实际需求 作为开发者,我们经常需要将技术笔记、项目文档或学习成果以网站形式对外展示。这种展示方式相比简单的代码仓库浏览具有明显优势,包括统一的导航结构、专业的视觉呈现、便捷的搜索功能以及更好的阅读体验。本文将详细介绍如何使用 MkDo 阅读全文
posted @ 2026-02-08 18:56 石头开会 阅读(365) 评论(0) 推荐(0)
摘要: 推荐算法闲谈:如何在不同业务场景下理解和拆解核心指标 在推荐系统工程实践中,实验业务指标分析能力也是一名算法工程师的在工作中逐渐积累能力。模型能力、特征工程、训练技巧解决的是能不能学好,而指标分析解决的是这次改动是否真正创造了业务价值,以及为什么。 一个非常常见、但又极易被忽视的事实是:推荐系统并不 阅读全文
posted @ 2026-01-12 10:18 石头开会 阅读(671) 评论(1) 推荐(2)
摘要: AUC 的两种等价定义:从排序概率到 ROC 曲线的统一理解 在推荐系统与广告排序中,AUC 是最常用、也最容易被误解的离线评估指标之一。很多人同时接触过两种说法: 一种是“ROC 曲线下面积”,另一种是“正样本排在负样本前面的概率”。这并不是两种不同的指标,而是同一个指标的两种完全等价的定义。 一 阅读全文
posted @ 2026-01-06 20:27 石头开会 阅读(765) 评论(0) 推荐(0)