GlenTt

导航

#

[置顶] 看一遍就懂-大模型架构及encoder-decoder详细训练和推理计算过程

摘要: 看一遍就懂-大模型架构及encoder-decoder详细训练和推理计算过程 一、特殊Token的意思 不同模型架构的特殊token体系 BERT(Encoder-only,用于理解任务): <CLS>:放在句首,用于分类任务,其输出向量代表整句语义 <SEP>:分隔符,用于句对任务(如问答、文本蕴 阅读全文

posted @ 2026-01-25 18:21 GlenTt 阅读(439) 评论(0) 推荐(0)

#

[置顶] 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践

摘要: 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践 原文:https://arxiv.org/pdf/2508.12665 一、引言:问题背景与研究动机 在短视频推荐系统中,观看时长(Watch Time)被广泛视为衡量用户满意度与内容质量的核心信号之一。与点击、点赞等离散反馈不同 阅读全文

posted @ 2025-12-29 17:56 GlenTt 阅读(664) 评论(0) 推荐(0)

#

[置顶] 从负反馈中学习并衡量序列推荐系统的响应能力

摘要: 从负反馈中学习并衡量序列推荐系统的响应能力 Google RecSys’23 —Learning from Negative User Feedback and Measuring Responsiveness for Sequential Recommenders 一、问题背景与研究动机 在工业级 阅读全文

posted @ 2025-12-24 15:04 GlenTt 阅读(604) 评论(0) 推荐(0)

#

[置顶] 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术

摘要: 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术 引言 近年来,大规模推荐系统正经历一场深刻的范式演进,其趋势是从传统的双塔召回模型(Dual-Encoder + ANN)向更为灵活和强大的生成式检索(Generative Retrieval)范式迁移。后者借鉴了自然语言处理领域的成功经验 阅读全文

posted @ 2025-09-16 16:10 GlenTt 阅读(4700) 评论(2) 推荐(2)

#

[置顶] 注意力机制:从核心原理到前沿应用

摘要: 注意力机制:从核心原理到前沿应用 注意力机制:从核心原理到前沿应用 如果你关注人工智能,无论是惊艳世人的GPT-4,还是精准洞察你购物偏好的推荐引擎,它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。 然而,随着技术飞速发展,Attention的“家族”也日益庞大:Self-Attentio 阅读全文

posted @ 2025-09-15 10:17 GlenTt 阅读(819) 评论(0) 推荐(2)

2026年2月21日 #

RankMixer: Scaling Up Ranking Models in Industrial Recommenders

摘要: RankMixer:在工业级推荐系统中扩展排序模型 摘要 近年来,大语言模型(LLMs)的快速发展激发了将推荐系统进行大规模扩展的研究兴趣,但在工业实践中仍面临两项关键挑战。第一,工业级推荐系统在训练和在线推理阶段必须满足严格的时延约束和高并发(QPS)需求,计算与服务成本受到强约束。第二,现有排序 阅读全文

posted @ 2026-02-21 12:19 GlenTt 阅读(86) 评论(0) 推荐(0)

2026年2月14日 #

OneTrans:在工业级推荐系统中以单一 Transformer 实现特征交互与序列建模的统一框架

摘要: OneTrans:在工业级推荐系统中以单一 Transformer 实现特征交互与序列建模的统一框架 摘要 在推荐系统中,扩展特征交互模块(例如 Wukong、RankMixer)或用户行为序列模块(例如 LONGER)已经取得了显著成果。然而,这两类工作通常沿着彼此独立的路径推进,这不仅阻碍了双向 阅读全文

posted @ 2026-02-14 11:31 GlenTt 阅读(119) 评论(0) 推荐(0)

2026年2月8日 #

GitHub Pages 技术文档站点搭建实践指南

摘要: GitHub Pages 技术文档站点搭建实践指南 1. 开发者的实际需求 作为开发者,我们经常需要将技术笔记、项目文档或学习成果以网站形式对外展示。这种展示方式相比简单的代码仓库浏览具有明显优势,包括统一的导航结构、专业的视觉呈现、便捷的搜索功能以及更好的阅读体验。本文将详细介绍如何使用 MkDo 阅读全文

posted @ 2026-02-08 18:56 GlenTt 阅读(204) 评论(0) 推荐(0)

2026年1月12日 #

推荐算法闲谈:如何在不同业务场景下理解和拆解核心指标

摘要: 推荐算法闲谈:如何在不同业务场景下理解和拆解核心指标 在推荐系统工程实践中,实验业务指标分析能力也是一名算法工程师的在工作中逐渐积累能力。模型能力、特征工程、训练技巧解决的是能不能学好,而指标分析解决的是这次改动是否真正创造了业务价值,以及为什么。 一个非常常见、但又极易被忽视的事实是:推荐系统并不 阅读全文

posted @ 2026-01-12 10:18 GlenTt 阅读(552) 评论(0) 推荐(1)

2026年1月6日 #

AUC 的两种等价定义:从排序概率到 ROC 曲线的统一理解

摘要: AUC 的两种等价定义:从排序概率到 ROC 曲线的统一理解 在推荐系统与广告排序中,AUC 是最常用、也最容易被误解的离线评估指标之一。很多人同时接触过两种说法: 一种是“ROC 曲线下面积”,另一种是“正样本排在负样本前面的概率”。这并不是两种不同的指标,而是同一个指标的两种完全等价的定义。 一 阅读全文

posted @ 2026-01-06 20:27 GlenTt 阅读(614) 评论(0) 推荐(0)

2026年1月5日 #

推荐系统模型优化-工程实践流程

摘要: 推荐系统模型优化-工程实践流程 在大规模推荐系统中,模型或策略的修改并不是一次简单的效果优化,而是一项涉及业务目标、系统稳定性和长期收益的工程化决策。随着用户规模和内容规模的持续扩大,单次模型改动往往会对整体分发生态产生放大效应,如果缺乏规范流程,极易带来隐性风险或短期收益、长期损失的问题。因此,互 阅读全文

posted @ 2026-01-05 16:38 GlenTt 阅读(64) 评论(0) 推荐(0)

2026年1月2日 #

Python和C++数据结构整理

摘要: Python和C++数据结构整理 引言 数据结构是软件开发的基石,但许多开发者对数据结构的分类和选型仍存在认知盲区。本文将系统梳理数据结构的逻辑分类,深入剖析C++和Python中常用数据结构的底层实现与应用场景,通过实际代码示例帮助开发者建立完整的知识体系。 第一部分:数据结构的逻辑分类 逻辑结构 阅读全文

posted @ 2026-01-02 13:24 GlenTt 阅读(692) 评论(0) 推荐(2)