摘要: RecSDK 方案概述 Rec SDK作为基于昇腾平台的搜索推荐广告框架,为支撑大规模搜索推荐广告场景,提供多种功能特性,助力完成搜索推荐广告模型的高效训练。如下表这张图展示了推荐SDK在昇腾软硬生态中的位置: 硬件方面,SDK可在已发布的训练服务器Atlas 800T A2和Atlas 800I 阅读全文
posted @ 2025-12-27 15:13 永荣带你玩转昇腾 阅读(2) 评论(0) 推荐(0)
摘要: 昇腾适配GR(生成式推荐)模型实践 摘要/引言 简要介绍GR模型在生成式推荐领域的重要性。 阐述将GR模型适配到昇腾NPU的战略意义与技术挑战。 概述本文将要展示的适配路径、关键技术与最终成果。 一、 GR模型核心原理 1.1 GR模型背景介绍 生成式推荐的兴起是推荐系统领域应对互联网“存量时代”挑 阅读全文
posted @ 2025-12-27 15:09 永荣带你玩转昇腾 阅读(3) 评论(0) 推荐(0)
摘要: FBGEMM算子库 1. FBGEMM算子库(gitee.com) Torchrec是Pytorch社区的官方推荐库,为支持使用torchrec训练相关模型,需要在昇腾上适配torchrec模型使用到的基础算子。由于本方案中主要涉及到的模型有DCNV2和GR模型,分别是传统推荐和生成式推荐代表模型。 阅读全文
posted @ 2025-12-27 15:02 永荣带你玩转昇腾 阅读(2) 评论(0) 推荐(0)
摘要: 嵌入表性能提升:优化策略及算法介绍 1、 多流并行策略(MultiStream多流并行) 多流并行机制通过对通信和计算过程进行掩盖来有效地减少训练过程中的空泡率,Torchrec中TrainPipelineSparseDist模块实现的是NV的方案,其通过三流并行机制来将计算和通信过程进行掩盖,有效 阅读全文
posted @ 2025-12-27 14:58 永荣带你玩转昇腾 阅读(4) 评论(0) 推荐(0)
摘要: 昇腾流水线优化技术详解 1. pipeline多级流水 Pipeline多级流水的核心思想是将训练步骤拆分为多个连续的阶段(Stage),通过异步调度,使不同批次的处理过程在流水线上重叠执行。这种流水线并行机制有效掩盖了阶段间的通信与计算耗时,从而显著提升了训练吞吐量与硬件利用率。 如下图所示,一个 阅读全文
posted @ 2025-12-27 14:45 永荣带你玩转昇腾 阅读(3) 评论(0) 推荐(0)
摘要: 准入淘汰策略详解 准入淘汰策略主要应用于推荐系统的多级缓存架构中,是推荐模型训练过程中缓存管理的核心组成部分。它位于训练流程的缓存管理层,负责动态管理嵌入表(embedding table)中特征的存储和生命周期。 在大规模的稀疏场景下的模型训练,部分特征频次较低,无法为模型的训练提供有效的信息,同 阅读全文
posted @ 2025-12-27 14:41 永荣带你玩转昇腾 阅读(1) 评论(0) 推荐(0)
摘要: 单双层架构解析 Meta GR 等系列研究揭示,推荐系统的性能同样遵循 Scaling Law,即通过扩展模型规模(尤其是CTR模型中的稀疏与稠密参数)能够带来效果的持续提升。这一规律正驱动着京东等互联网企业积极布局大规模推荐系统的研发。如下表所示,为应对十亿至万亿级别的稀疏特征,字节跳动、谷歌与京 阅读全文
posted @ 2025-12-27 14:39 永荣带你玩转昇腾 阅读(1) 评论(0) 推荐(0)
摘要: 嵌入表分片与哈希管理:支撑万亿参数的关键技术 1、 Hash管理及实现 如下图所示:在推荐系统中,大部分ID的原始特征都是离散型(global ids),因为其取值空间巨大且稀疏(如用户ID或物品ID可能达到百万甚至亿级别),直接作为输入会导致嵌入表维度爆炸,引发存储和计算瓶颈。常见的做法是需要将离 阅读全文
posted @ 2025-12-27 14:32 永荣带你玩转昇腾 阅读(0) 评论(0) 推荐(0)
摘要: 昇腾推荐系统架构解析:嵌入表存储到多级缓存的全链路设计 1. 昇腾 A2 处理器架构与 Embedding 优化策略 昇腾 A2 处理器采用独特的达芬奇架构,具备完整的片上多级缓存系统。其缓存体系并非"以 CPU 为中心的多级缓存替代方案",而是基于自身架构理念设计了高效的多级缓存机制,与 NVID 阅读全文
posted @ 2025-12-27 13:52 永荣带你玩转昇腾 阅读(1) 评论(0) 推荐(0)
摘要: 1、问题与挑战 推荐系统中的用户(User)、物品(Item)及上下文(Context)特征具有高度异构性,其物理含义和量纲差异显著。为将这些特征有效引入深度神经网络(DNN),须通过Embedding技术将其映射为统一的低维稠密向量表示,从而解决特征间的语义鸿沟并提升模型泛化能力。为提升推荐系统的 阅读全文
posted @ 2025-12-27 13:44 永荣带你玩转昇腾 阅读(0) 评论(0) 推荐(0)