GlenTt

导航

#

[置顶] 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术

摘要: 深度剖析RQ-VAE:从向量量化到生成式推荐的语义ID技术 引言 近年来,大规模推荐系统正经历一场深刻的范式演进,其趋势是从传统的双塔召回模型(Dual-Encoder + ANN)向更为灵活和强大的生成式检索(Generative Retrieval)范式迁移。后者借鉴了自然语言处理领域的成功经验 阅读全文

posted @ 2025-09-16 16:10 GRITJW 阅读(2726) 评论(0) 推荐(1)

#

[置顶] 注意力机制:从核心原理到前沿应用

摘要: 注意力机制:从核心原理到前沿应用 注意力机制:从核心原理到前沿应用 如果你关注人工智能,无论是惊艳世人的GPT-4,还是精准洞察你购物偏好的推荐引擎,它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。 然而,随着技术飞速发展,Attention的“家族”也日益庞大:Self-Attentio 阅读全文

posted @ 2025-09-15 10:17 GRITJW 阅读(525) 评论(0) 推荐(2)

2025年11月8日 #

Bash 入门指南-简介和常见命令

摘要: Bash 入门指南(第一部分):Bash 简介 概述 Bash(Bourne Again Shell)是目前 Unix 和 Linux 系统中最广泛使用的命令行解释器,也是绝大多数 Linux 发行版的默认 Shell。作为用户与操作系统内核之间的桥梁,Bash 不仅提供了强大的命令行交互环境,还支 阅读全文

posted @ 2025-11-08 19:27 GRITJW 阅读(531) 评论(0) 推荐(3)

2025年11月7日 #

什么是 Feed 流?

摘要: 什么是 Feed 流? 摘要 Feed 源自“被投喂的更新条目”,流指“连续滚动的呈现与计算范式”;Feed 流就是平台按流式形态持续投喂个性化内容给用户的机制与界面。 本质上,它是一个在实时反馈下运行的序列化个性化排名系统:内容持续产出 → 召回与多阶段排序 → 去重与重排 → 展示与交互 → 反 阅读全文

posted @ 2025-11-07 19:58 GRITJW 阅读(51) 评论(0) 推荐(0)

2025年11月2日 #

Git 协作实战与 Gerrit 评审流程

摘要: Git 协作实战与 Gerrit 评审流程 适用场景:公司内网仓库 + Gerrit 评审流程;服务器上 Git 版本较老(无 git switch、git restore)。 示例仓库:/home/aaa/bbb/ccc,远端别名 origin。 1. 背景与目标 协作开发的痛点集中在:分支基线不 阅读全文

posted @ 2025-11-02 18:23 GRITJW 阅读(193) 评论(0) 推荐(3)

2025年10月15日 #

从SGD到AdamW:深度学习优化器演进全解析与实践指南

摘要: 从SGD到AdamW:深度学习优化器演进全解析与实践指南 从SGD到AdamW:深度学习优化器演进全解析与实践指南 摘要 在深度学习中,优化器(Optimizer)是连接模型与数据的桥梁,它负责根据损失函数的梯度来更新模型的参数,以期找到一组能最小化损失的“最优解”。优化器的选择和调优,直接关系到模型的训练速度、收敛性以及最终的泛化能力。本文将遵循“问题提 阅读全文

posted @ 2025-10-15 16:45 GRITJW 阅读(505) 评论(0) 推荐(1)

2025年10月11日 #

论文分享-ETEGRec:端到端可学习的物品分词与生成式推荐

摘要: ETEGRec:端到端可学习的物品分词与生成式推荐 摘要 现有生成式推荐多采用"两阶段"范式:先离线构造语义标识(Semantic ID),再以固定标识训练生成器,导致分词器与生成器目标失配、分布不一致。ETEGRec 将 RQ-VAE 物品分词器与 T5 式生成器统一到一个端到端框架中,并引入两类 阅读全文

posted @ 2025-10-11 11:51 GRITJW 阅读(135) 评论(0) 推荐(0)

2025年10月10日 #

KV Cache 与 MQA/GQA:从推理优化看注意力机制的工程化演进

摘要: KV Cache 与 MQA/GQA:从推理优化看注意力机制的工程化演进 本文将从自回归推理的工程需求出发,系统阐述 KV Cache 的本质、设计原理及其如何自然引出多查询注意力(MQA)与分组查询注意力(GQA)的优化路径。 一、自回归推理的瓶颈与 KV Cache 的诞生 在 Transfor 阅读全文

posted @ 2025-10-10 19:46 GRITJW 阅读(149) 评论(2) 推荐(1)

2025年10月9日 #

QARM:多模态语义对齐与量化在推荐系统中的实践路径

摘要: QARM:多模态语义对齐与量化在推荐系统中的实践路径 在短视频、电商、广告等多模态内容密集的业务中,如何让推荐系统真正理解"内容语义"成为关键挑战。传统的推荐系统依赖 ID-based 特征(如用户 ID、物品 ID、场景 ID),而多模态信息(如图像、文本、音频)通常以固定向量的形式加入模型输入, 阅读全文

posted @ 2025-10-09 18:47 GRITJW 阅读(319) 评论(0) 推荐(0)

语义Id论文精读:COBRA《Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations》

摘要: 语义Id论文精读:COBRA《Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations》 大家好,接下来我将为大家系统性地梳理语义ID在推荐领域的两大主流技术路线 阅读全文

posted @ 2025-10-09 10:08 GRITJW 阅读(211) 评论(0) 推荐(0)

2025年10月8日 #

语义ID论文精读《Better Generalization with Semantic IDs: A Case Study in Ranking for Recommendations》

摘要: 语义ID论文精读《Better Generalization with Semantic IDs: A Case Study in Ranking for Recommendations》 大家好,接下来我将为大家系统性地梳理语义ID在推荐领域的两大主流技术路线相关论文,在此之前我先给出我目前关于语 阅读全文

posted @ 2025-10-08 14:51 GRITJW 阅读(492) 评论(0) 推荐(1)

2025年10月7日 #

强化学习系统性学习笔记(二):策略优化的理论基础与算法实现

摘要: 策略优化的理论基础与算法实现 3.2 REINFORCE: 最早的策略梯度算法 在完成策略梯度定理的推导后,我们获得了梯度的理论形式: \[\nabla_\theta J(\pi_\theta) = \mathbb{E}_{\tau \sim \pi_\theta}\left[\sum_{t=0}^ 阅读全文

posted @ 2025-10-07 11:54 GRITJW 阅读(182) 评论(0) 推荐(1)