GRITJW - 博客园

[置顶] 深度剖析RQ-VAE：从向量量化到生成式推荐的语义ID技术

摘要：深度剖析RQ-VAE：从向量量化到生成式推荐的语义ID技术引言近年来，大规模推荐系统正经历一场深刻的范式演进，其趋势是从传统的双塔召回模型（Dual-Encoder + ANN）向更为灵活和强大的生成式检索（Generative Retrieval）范式迁移。后者借鉴了自然语言处理领域的成功经验阅读全文

posted @ 2025-09-16 16:10 GRITJW 阅读(1212) 评论(0) 推荐(0)

[置顶] 注意力机制：从核心原理到前沿应用

摘要：

注意力机制：从核心原理到前沿应用如果你关注人工智能，无论是惊艳世人的GPT-4，还是精准洞察你购物偏好的推荐引擎，它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。然而，随着技术飞速发展，Attention的“家族”也日益庞大：Self-Attentio 阅读全文

posted @ 2025-09-15 10:17 GRITJW 阅读(462) 评论(0) 推荐(2)

从SGD到AdamW：深度学习优化器演进全解析与实践指南

摘要：

从SGD到AdamW：深度学习优化器演进全解析与实践指南摘要在深度学习中，优化器（Optimizer）是连接模型与数据的桥梁，它负责根据损失函数的梯度来更新模型的参数，以期找到一组能最小化损失的“最优解”。优化器的选择和调优，直接关系到模型的训练速度、收敛性以及最终的泛化能力。本文将遵循“问题提阅读全文

posted @ 2025-10-15 16:45 GRITJW 阅读(296) 评论(0) 推荐(1)

GlenTt

导航

公告

[置顶] 深度剖析RQ-VAE：从向量量化到生成式推荐的语义ID技术

[置顶] 注意力机制：从核心原理到前沿应用

从SGD到AdamW：深度学习优化器演进全解析与实践指南

论文分享-ETEGRec：端到端可学习的物品分词与生成式推荐

KV Cache 与 MQA/GQA：从推理优化看注意力机制的工程化演进

QARM：多模态语义对齐与量化在推荐系统中的实践路径

语义Id论文精读：COBRA《Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations》

语义ID论文精读《Better Generalization with Semantic IDs: A Case Study in Ranking for Recommendations》

强化学习系统性学习笔记（二）：策略优化的理论基础与算法实现

InstructGPT 论文略读：三步走，让大模型真正听懂人话

强化学习系统性学习笔记（一）：从理论基础到策略优化

推荐系统中损失函数梳理：从Pointwise到Listwise