随笔分类 - research
摘要:AMOS: Enabling Automatic Mapping for Tensor Computations On Spatial Accelerators with Hardware Abstraction Abstract 为了实现性能提升,硬件专用化是一个趋势。空间硬件加速器利用专门的层次
阅读全文
摘要:Abstract 在多种多样的设备上部署深度学习模型是一个重要的话题,专用硬件的蓬勃发展引入了一系列加速原语和多维张量计算方法。这些新的加速原语和不断出现的新的机器学习模型,带来了工程上的巨大挑战。本文提出了TensorIR,是为了优化这些有张量计算原语的张量化程序而设计的编译器抽象。TensorI
阅读全文
摘要:Ansor:Generating High-Performance Tensor Program for Deep Learning Abstract 高性能的张量程序对于保证深度神经网络的高效执行十分关键,但是在不同硬件平台上获取高性能的张量程序并不容易。近年的研究中,深度学习系统依赖硬件供应商提
阅读全文
摘要:The Deep Learning Compiler: A Comprehensive Survey - [AI编译器综述](#ai编译器综述) - [摘要](#摘要) - [介绍](#介绍) - [背景](#背景) - [深度学习框架](#深度学习框架) - [深度学习硬件](#深度学习硬件) -
阅读全文

浙公网安备 33010602011771号