摘要:
RecSDK 方案概述 Rec SDK作为基于昇腾平台的搜索推荐广告框架,为支撑大规模搜索推荐广告场景,提供多种功能特性,助力完成搜索推荐广告模型的高效训练。如下表这张图展示了推荐SDK在昇腾软硬生态中的位置: 硬件方面,SDK可在已发布的训练服务器Atlas 800T A2和Atlas 800I 阅读全文
posted @ 2025-12-27 15:13
永荣带你玩转昇腾
阅读(2)
评论(0)
推荐(0)
摘要:
昇腾适配GR(生成式推荐)模型实践 摘要/引言 简要介绍GR模型在生成式推荐领域的重要性。 阐述将GR模型适配到昇腾NPU的战略意义与技术挑战。 概述本文将要展示的适配路径、关键技术与最终成果。 一、 GR模型核心原理 1.1 GR模型背景介绍 生成式推荐的兴起是推荐系统领域应对互联网“存量时代”挑 阅读全文
posted @ 2025-12-27 15:09
永荣带你玩转昇腾
阅读(3)
评论(0)
推荐(0)
摘要:
FBGEMM算子库 1. FBGEMM算子库(gitee.com) Torchrec是Pytorch社区的官方推荐库,为支持使用torchrec训练相关模型,需要在昇腾上适配torchrec模型使用到的基础算子。由于本方案中主要涉及到的模型有DCNV2和GR模型,分别是传统推荐和生成式推荐代表模型。 阅读全文
posted @ 2025-12-27 15:02
永荣带你玩转昇腾
阅读(2)
评论(0)
推荐(0)
摘要:
嵌入表性能提升:优化策略及算法介绍 1、 多流并行策略(MultiStream多流并行) 多流并行机制通过对通信和计算过程进行掩盖来有效地减少训练过程中的空泡率,Torchrec中TrainPipelineSparseDist模块实现的是NV的方案,其通过三流并行机制来将计算和通信过程进行掩盖,有效 阅读全文
posted @ 2025-12-27 14:58
永荣带你玩转昇腾
阅读(4)
评论(0)
推荐(0)
摘要:
昇腾流水线优化技术详解 1. pipeline多级流水 Pipeline多级流水的核心思想是将训练步骤拆分为多个连续的阶段(Stage),通过异步调度,使不同批次的处理过程在流水线上重叠执行。这种流水线并行机制有效掩盖了阶段间的通信与计算耗时,从而显著提升了训练吞吐量与硬件利用率。 如下图所示,一个 阅读全文
posted @ 2025-12-27 14:45
永荣带你玩转昇腾
阅读(3)
评论(0)
推荐(0)
摘要:
准入淘汰策略详解 准入淘汰策略主要应用于推荐系统的多级缓存架构中,是推荐模型训练过程中缓存管理的核心组成部分。它位于训练流程的缓存管理层,负责动态管理嵌入表(embedding table)中特征的存储和生命周期。 在大规模的稀疏场景下的模型训练,部分特征频次较低,无法为模型的训练提供有效的信息,同 阅读全文
posted @ 2025-12-27 14:41
永荣带你玩转昇腾
阅读(1)
评论(0)
推荐(0)

浙公网安备 33010602011771号