昇腾RecSDK Torch整体方案介绍

RecSDK 方案概述

Rec SDK作为基于昇腾平台的搜索推荐广告框架,为支撑大规模搜索推荐广告场景,提供多种功能特性,助力完成搜索推荐广告模型的高效训练。如下表这张图展示了推荐SDK在昇腾软硬生态中的位置:

aaa_01

  1. 硬件方面,SDK可在已发布的训练服务器Atlas 800T A2和Atlas 800I A2推理服务器进行训练和推理作业。

  2. 神经网络计算架构CANN为包括推荐SDK在内的所有上层应用提供了丰富、强大的算子能力、图引擎能力还有通信能力。

  3. 框架适配,推荐SDK的API也针对tensorflow和pytorch框架进行了更亲和的适配,提供高度兼容的API接口,实现模型的无缝迁移与快速迭代。

  4. 模型开发:提供了极简易用的API,符合开发tensorflow和pytorch原生模型的流程和使用方式,降低用户的学习成本;提供的样例模型,使用户能够快速复现基准模型;提供了模型迁移手册和精度调优手册,让用户能够更快地掌握业务模型的迁移和调优。

  5. 模型训练:RecSDK的核心能力主要集中在计算和稀疏表存储上。计算又分为CPU侧和NPU侧,CPU侧对样本做了并行加速处理,提供了特征准入、淘汰和映射等功能;NPU侧,对关键算子(如HSTU、Fbgemm)进行深度优化与融合,充分发挥昇腾硬件算力。

关键性能特性

通过上述功能,Rec SDK构建了一套完整、高效的大规模推荐系统训练解决方案,显著提升模型开发与部署效率。

posted @ 2025-12-27 15:13  永荣带你玩转昇腾  阅读(0)  评论(0)    收藏  举报