摘要: 端到端TVM编译器(下) 4.3 Tensorization DL工作负载具有很高的运算强度,通常可以分解为张量运算符,如矩阵乘法或一维卷积。这些自然分解导致了最近的添加张量计算原语。这些新的原语带来了机遇和挑战调度;为了 提高性能,编译框架必须无缝集成。称之为张量化:类似于SIMD体系结构的矢量化 阅读全文
posted @ 2021-05-05 09:32 吴建明wujianming 阅读(1107) 评论(0) 推荐(0)