AI编译器 - 随笔分类 - 稳住·能赢

【MLIR】Linalg中FuseElementwiseOps梳理

摘要：Linalg的FuseElementwiseOps梳理 1 引言在编译器优化中，算子融合（Operator Fusion）是一项关键技术，它通过合并多个连续的计算操作来减少中间结果的materialization，从而降低内存带宽需求并提升缓存利用率。MLIR的Linalg方言提供了强大的算子融合阅读全文

posted @ 2026-01-06 21:15 稳住·能赢阅读(4) 评论(0) 推荐(0)

【MLIR】Linalg融合中Producer输出Indexing Map的Permutation校验分析

摘要：Linalg融合中Producer输出Indexing Map的Permutation检查分析 1. 问题背景代码位置 // ElementwiseOpFusion.cpp:175-178 AffineMap producerResultIndexMap = producer.getMatchin 阅读全文

posted @ 2026-01-06 21:00 稳住·能赢阅读(4) 评论(0) 推荐(0)

【MLIR】Tensor vs MemRef

摘要：Tensor vs MemRef 1. 基本概念对比特性 Tensor MemRef 语义值语义（Value Semantics）引用语义（Reference Semantics）可变性不可变（Immutable）可变（Mutable）内存模型抽象的，不关心内存具体的内存缓冲区别阅读全文

posted @ 2026-01-06 20:11 稳住·能赢阅读(3) 评论(0) 推荐(0)

【inductor】scheduler中的can_fuse详细学习

摘要：PyTorch Inductor Scheduler can_fuse 流程深度解析本文深入剖析 PyTorch Inductor 编译器中算子融合（Operator Fusion）的核心决策流程 can_fuse，详细解析融合条件检查、特殊融合类型、优化策略等关键实现。目录流程概述融合决策阅读全文

posted @ 2025-12-30 21:20 稳住·能赢阅读(7) 评论(0) 推荐(0)

【inductor】scheduler学习

摘要：PyTorch Inductor Scheduler 模块深度解析本文详细解析 PyTorch 2.x Inductor 编译器的核心调度模块 torch/_inductor/scheduler.py，深入探讨其架构设计、算子融合策略、内存优化技术等关键实现。目录模块概述核心架构主要类详解阅读全文

posted @ 2025-12-30 21:19 稳住·能赢阅读(6) 评论(0) 推荐(0)

【onnx-mlir】IndexExpr功能学习

摘要：ONNX-MLIR IndexExpr系统分析学习 < IndexExpr 是 onnx-mlir 项目的核心基础设施之一，它提供了一套统一的接口来处理编译时常量和运行时动态值，是形状推断和代码生成的关键组件。 1. 引言 1.1 设计动机在深度学习编译器中，索引计算无处不在：形状推断：计算输出阅读全文

posted @ 2025-12-30 19:31 稳住·能赢阅读(5) 评论(0) 推荐(0)

【onnx-mlir】DialectBuilder设计学习

摘要：ONNX-MLIR DialectBuilder设计整理本文深入剖析 onnx-mlir 项目中的 DialectBuilder 设计模式，帮助开发者理解如何优雅地构建 MLIR 操作。 1. 引言在 MLIR 编译器开发中，我们经常需要创建大量的 IR 操作。直接使用 OpBuilder 虽然阅读全文

posted @ 2025-12-30 14:42 稳住·能赢阅读(9) 评论(0) 推荐(0)

【onnx-mlir】ShapeHelper功能学习

摘要：ONNX-MLIR ShapeHelper 深度解析本文深入剖析 onnx-mlir 项目中的 ShapeHelper 基础设施，帮助开发者理解如何在编译时和运行时计算 ONNX 操作的输出形状。 1. 引言在深度学习编译器中，形状推断（Shape Inference）是核心功能之一。准确的形阅读全文

posted @ 2025-12-30 12:53 稳住·能赢阅读(8) 评论(0) 推荐(0)

【onnx-mlir】DimAnalysis功能学习

摘要：DimAnalysis 动态维度分析 1. 概述 DimAnalysis 是onnx-mlir中用于在编译时分析动态维度之间等价关系的工具类。它能够判断两个动态维度在运行时是否相等，从而帮助编译器做出更优的代码生成决策。 2. 核心作用 2.1 消除不必要的广播代码当两个张量的动态维度已知相等时，阅读全文

posted @ 2025-12-30 10:03 稳住·能赢阅读(9) 评论(0) 推荐(1)

稳住·能赢

讲人话，都能懂。

随笔分类 - AI编译器

公告