TVM安装常用问题

TVM安装常用问题

如何添加新的硬件后端

TVM与其他IR / DSL项目的关系

在深度学习系统中,IR通常有两个抽象层次。TensorFlow的XLA和Intel的ngraph都使用计算图表示。这种表示形式是高级的,并且有助于执行通用优化,例如内存重用,布局转换和自动微分。

TVM采用低级表示,可明确表示内存布局,并行化模式,局部性和硬件基元等的选择。此IR级别更接近直接针对目标硬件。低级IR采用了来自现有图像处理语言(例如Halide),暗室darkroom和循环转换工具(例如基于loopy和基于多面体的分析)的思想。特别专注于表达深度学习工作负载(例如,递归),针对不同硬件后端的优化以及嵌入框架以提供端到端编译堆栈。

TVMlibDNNcuDNN的关系

TVM可以将这些库合并为外部调用。TVM的目标之一是能够生成高性能内核。当从人工内核技术中学习,逐步将它们添加为DSL中的原语,逐步发展TVM。另请参阅前面内容以了解TVM中算子的配置。

https://tvm.apache.org/docs/faq.html

posted @ 2020-12-23 06:35  吴建明wujianming  阅读(139)  评论(0编辑  收藏  举报