GlenTt

导航

#

[置顶] 看一遍就懂-大模型架构及encoder-decoder详细训练和推理计算过程

摘要: 看一遍就懂-大模型架构及encoder-decoder详细训练和推理计算过程 一、特殊Token的意思 不同模型架构的特殊token体系 BERT(Encoder-only,用于理解任务): <CLS>:放在句首,用于分类任务,其输出向量代表整句语义 <SEP>:分隔符,用于句对任务(如问答、文本蕴 阅读全文

posted @ 2026-01-25 18:21 GlenTt 阅读(201) 评论(0) 推荐(0)

#

[置顶] 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践

摘要: 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践 从点预测到分布建模:小红书-EGMN在视频观看时长预测中的方法与实践 原文:https://arxiv.org/pdf/2508.12665 一、引言:问题背景与研究动机 在短视频推荐系统中,观看时长(Watch Time)被广泛视为衡量用户满意度与内容质量的核心信号之一。与点击、点赞等离散反馈不同 阅读全文

posted @ 2025-12-29 17:56 GlenTt 阅读(189) 评论(0) 推荐(0)

#

[置顶] 从负反馈中学习并衡量序列推荐系统的响应能力

摘要: 从负反馈中学习并衡量序列推荐系统的响应能力 Google RecSys’23 —Learning from Negative User Feedback and Measuring Responsiveness for Sequential Recommenders 一、问题背景与研究动机 在工业级 阅读全文

posted @ 2025-12-24 15:04 GlenTt 阅读(166) 评论(0) 推荐(0)

#

[置顶] 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术

摘要: 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术 引言 近年来,大规模推荐系统正经历一场深刻的范式演进,其趋势是从传统的双塔召回模型(Dual-Encoder + ANN)向更为灵活和强大的生成式检索(Generative Retrieval)范式迁移。后者借鉴了自然语言处理领域的成功经验 阅读全文

posted @ 2025-09-16 16:10 GlenTt 阅读(4276) 评论(2) 推荐(2)

#

[置顶] 注意力机制:从核心原理到前沿应用

摘要: 注意力机制:从核心原理到前沿应用 注意力机制:从核心原理到前沿应用 如果你关注人工智能,无论是惊艳世人的GPT-4,还是精准洞察你购物偏好的推荐引擎,它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。 然而,随着技术飞速发展,Attention的“家族”也日益庞大:Self-Attentio 阅读全文

posted @ 2025-09-15 10:17 GlenTt 阅读(752) 评论(0) 推荐(2)

2026年1月12日 #

推荐算法闲谈:如何在不同业务场景下理解和拆解核心指标

摘要: 推荐算法闲谈:如何在不同业务场景下理解和拆解核心指标 在推荐系统工程实践中,实验业务指标分析能力也是一名算法工程师的在工作中逐渐积累能力。模型能力、特征工程、训练技巧解决的是能不能学好,而指标分析解决的是这次改动是否真正创造了业务价值,以及为什么。 一个非常常见、但又极易被忽视的事实是:推荐系统并不 阅读全文

posted @ 2026-01-12 10:18 GlenTt 阅读(267) 评论(0) 推荐(1)

2026年1月6日 #

AUC 的两种等价定义:从排序概率到 ROC 曲线的统一理解

摘要: AUC 的两种等价定义:从排序概率到 ROC 曲线的统一理解 在推荐系统与广告排序中,AUC 是最常用、也最容易被误解的离线评估指标之一。很多人同时接触过两种说法: 一种是“ROC 曲线下面积”,另一种是“正样本排在负样本前面的概率”。这并不是两种不同的指标,而是同一个指标的两种完全等价的定义。 一 阅读全文

posted @ 2026-01-06 20:27 GlenTt 阅读(206) 评论(0) 推荐(0)

2026年1月5日 #

推荐系统模型优化-工程实践流程

摘要: 推荐系统模型优化-工程实践流程 在大规模推荐系统中,模型或策略的修改并不是一次简单的效果优化,而是一项涉及业务目标、系统稳定性和长期收益的工程化决策。随着用户规模和内容规模的持续扩大,单次模型改动往往会对整体分发生态产生放大效应,如果缺乏规范流程,极易带来隐性风险或短期收益、长期损失的问题。因此,互 阅读全文

posted @ 2026-01-05 16:38 GlenTt 阅读(53) 评论(0) 推荐(0)

2026年1月2日 #

Python和C++数据结构整理

摘要: Python和C++数据结构整理 引言 数据结构是软件开发的基石,但许多开发者对数据结构的分类和选型仍存在认知盲区。本文将系统梳理数据结构的逻辑分类,深入剖析C++和Python中常用数据结构的底层实现与应用场景,通过实际代码示例帮助开发者建立完整的知识体系。 第一部分:数据结构的逻辑分类 逻辑结构 阅读全文

posted @ 2026-01-02 13:24 GlenTt 阅读(267) 评论(0) 推荐(2)

2025年12月22日 #

推荐算法中的位置消偏,如何解决?

摘要: 位置偏差指的是:在用户 / item 不变的前提下,把同一条内容放在不同位置,用户的点击概率会系统性变化——这部分变化是由位置本身引起的,而不是内容质量变化引起的。 1.Recommending What Video to Watch Next: A Multitask Ranking System 阅读全文

posted @ 2025-12-22 16:22 GlenTt 阅读(204) 评论(0) 推荐(0)

2025年12月21日 #

浮点数的本质:为什么计算机无法精确表示0.1

摘要: 浮点数的本质:为什么计算机无法精确表示0.1 当你在 C++ 中写下 float x = 0.1; 时,你以为计算机存储的就是精确的 0.1。但事实是,计算机存储的是一个非常接近 0.1 的近似值。这不是编译器的缺陷,也不是硬件的问题,而是浮点数表示机制的必然结果。理解这个机制,是理解所有数值计算问 阅读全文

posted @ 2025-12-21 13:17 GlenTt 阅读(81) 评论(0) 推荐(0)

2025年12月13日 #

理解整数在计算机中的表示

摘要: 理解整数在计算机中的表示 理解计算机如何表示整数,不仅是学习编程语言的基础,更是掌握计算机系统设计哲学的关键。这篇文章将从最底层的物理存储单位开始,一步步构建起对整数表示的认知,最终理解为什么工程实践中我们要做出特定的类型选择。 第一层:物理基础——bit 与 byte 的本质关系 让我们从计算机存 阅读全文

posted @ 2025-12-13 22:44 GlenTt 阅读(158) 评论(2) 推荐(0)