摘要: PyTorch Inductor Scheduler can_fuse 流程深度解析 本文深入剖析 PyTorch Inductor 编译器中算子融合(Operator Fusion)的核心决策流程 can_fuse,详细解析融合条件检查、特殊融合类型、优化策略等关键实现。 目录 流程概述 融合决策 阅读全文
posted @ 2025-12-30 21:20 稳住·能赢 阅读(9) 评论(0) 推荐(0)
摘要: PyTorch Inductor Scheduler 模块深度解析 本文详细解析 PyTorch 2.x Inductor 编译器的核心调度模块 torch/_inductor/scheduler.py,深入探讨其架构设计、算子融合策略、内存优化技术等关键实现。 目录 模块概述 核心架构 主要类详解 阅读全文
posted @ 2025-12-30 21:19 稳住·能赢 阅读(8) 评论(0) 推荐(0)
摘要: ONNX-MLIR IndexExpr系统分析学习 < IndexExpr 是 onnx-mlir 项目的核心基础设施之一,它提供了一套统一的接口来处理编译时常量和运行时动态值,是形状推断和代码生成的关键组件。 1. 引言 1.1 设计动机 在深度学习编译器中,索引计算无处不在: 形状推断:计算输出 阅读全文
posted @ 2025-12-30 19:31 稳住·能赢 阅读(6) 评论(0) 推荐(0)
摘要: ONNX-MLIR DialectBuilder设计整理 本文深入剖析 onnx-mlir 项目中的 DialectBuilder 设计模式,帮助开发者理解如何优雅地构建 MLIR 操作。 1. 引言 在 MLIR 编译器开发中,我们经常需要创建大量的 IR 操作。直接使用 OpBuilder 虽然 阅读全文
posted @ 2025-12-30 14:42 稳住·能赢 阅读(10) 评论(0) 推荐(0)
摘要: ONNX-MLIR ShapeHelper 深度解析 本文深入剖析 onnx-mlir 项目中的 ShapeHelper 基础设施,帮助开发者理解如何在编译时和运行时计算 ONNX 操作的输出形状。 1. 引言 在深度学习编译器中,形状推断(Shape Inference) 是核心功能之一。准确的形 阅读全文
posted @ 2025-12-30 12:53 稳住·能赢 阅读(11) 评论(0) 推荐(0)
摘要: DimAnalysis 动态维度分析 1. 概述 DimAnalysis 是onnx-mlir中用于在编译时分析动态维度之间等价关系的工具类。它能够判断两个动态维度在运行时是否相等,从而帮助编译器做出更优的代码生成决策。 2. 核心作用 2.1 消除不必要的广播代码 当两个张量的动态维度已知相等时, 阅读全文
posted @ 2025-12-30 10:03 稳住·能赢 阅读(9) 评论(0) 推荐(1)