会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
吴建明
微信视频号:sph0RgSyDYV47z6 快手号:4874645212 抖音号:dy0so323fq2w 小红书号:95619019828 B站1:UID:3546863642871878 B站2:UID: 3546955410049087
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
112
113
114
115
116
117
118
119
120
···
371
下一页
2024年4月12日
张量编译器结构的结构化可重定目标方法
摘要: 张量编译器结构的结构化可重定目标方法 2.1结构化与可重定目标代码生成的框架图与动机 用于数值计算的代码生成方法传统上侧重于优化循环嵌套的性能。相关分析侧重于标量元素,因为循环嵌套的主体通常计算单个元素。这样的分析必须考虑内存依赖性与混叠。这些方法在过去进行了深入研究,并已达到高度成熟。当从像C或F
阅读全文
posted @ 2024-04-12 05:04 吴建明wujianming
阅读(102)
评论(0)
推荐(0)
2024年4月11日
IREE HLO与MLIR编译器
摘要: IREE HLO与MLIR编译器 MLIR(Multi-Level Intermediate Representation)是谷歌团队开发的开源编译器框架,提供了一套灵活的软件基础设施,以便规范中间表达式(IR)及其相互之间的转换,建立了一个友好的编译器开发平台,一些比较好的对MLIR框架解读可以参
阅读全文
posted @ 2024-04-11 04:42 吴建明wujianming
阅读(523)
评论(0)
推荐(0)
2024年4月10日
QAT量化感知训练
摘要: QAT量化感知训练 基本原理 相比训练后量化因为其不是全局最优而导致的精度损失,QAT量化感知训练能做到基于loss优化的全局最优,而尽可能的降低量化精度损失,其基本原理是:在fp32模型训练中就提前引入推理时量化导致的权重与激活的误差,用任务loss在训练集上来优化可学习的权重及量化的缩放与zp值
阅读全文
posted @ 2024-04-10 04:59 吴建明wujianming
阅读(961)
评论(0)
推荐(0)
2024年4月9日
算子量化技术基本概念
摘要: INT8量化分为非对称量化与对称量化。对称量化是非对称量化的一个特例, 通常对称量化的性能会优于非对称量化, 而精度上非对称量化更优。 非对称量化 如上图所示, 非对称量化其实就是把[min,max]范围内的数值定点到[-128, 127]或者[0, 255]区间。 从int8到float的量化公式
阅读全文
posted @ 2024-04-09 05:34 吴建明wujianming
阅读(355)
评论(0)
推荐(0)
2024年4月8日
从LLVM方言到LLVM IR,再到CodeGen
摘要: 从LLVM方言到LLVM IR,再到CodeGen 在中使用 toy 语言接入 MLIR,最终转化为 LLVM IR,具体的流程如下: .toy 源文件 —> AST —> MLIRGen(遍历AST生成MLIR表达式) —> Transformation(变形消除冗余) —> 下译 —> LLVM
阅读全文
posted @ 2024-04-08 05:03 吴建明wujianming
阅读(189)
评论(0)
推荐(0)
2024年4月7日
Codegen方言介绍
摘要: Codegen方言介绍 主要介绍CodeGen过程中使用的Dialect(方言),以及对设计演变的一些观察。 介绍 对MLIR基础架构中CodeGen进行概述,特别是LLVM项目代码库中可用的部分(upstream或intree)。虽然偶尔会提到LLVM项目代码库之外的MLIR用户,但没有被深入分析
阅读全文
posted @ 2024-04-07 05:09 吴建明wujianming
阅读(109)
评论(0)
推荐(0)
2024年4月6日
MLIR方法图片示例
摘要: MLIR方法图片示例 MLIR 更广泛的社区讨论强调的第二个特征是,典型的量子经典计算编译管道需要多个级别的IR抽象。QIR只代表编译器降低流水线中的一个抽象级别,它实际上是量子计算机物理控制所需转换为模拟脉冲之前的最低机器级别。当然,还有其他抽象层,特别是那些可能更接近程序员和所使用的语言的抽象层
阅读全文
posted @ 2024-04-06 05:38 吴建明wujianming
阅读(146)
评论(0)
推荐(0)
2024年4月5日
MLIR中间表示和编译器框架
摘要: MLIR中间表示和编译器框架 背景 随着深度学习技术的发展,深度学习技术也逐渐从学术研究的方向转向了实践应用的方向,这不仅对深度模型的准确率有了较高的需求,也对深度模型的推理速度有了越来越高的需求。 目前深度模型的推理引擎按照实现方式大体分为两类: 解释型推理引擎:一般包含一个模型解析器和一个模型解
阅读全文
posted @ 2024-04-05 05:11 吴建明wujianming
阅读(316)
评论(0)
推荐(0)
2024年4月4日
异常编译代码分析
摘要: 异常编译代码分析 https://lowlevelbits.org/compiling-ruby-part-5/ 调用堆栈、堆栈帧和程序计数器 在程序执行期间,机器维护指向正在执行的指令的指针。它被称为程序计数器(或指令指针)。 当调用一个方法时,程序计数器被设置为被调用函数(被调用者)上的第一条指
阅读全文
posted @ 2024-04-04 04:36 吴建明wujianming
阅读(18)
评论(0)
推荐(0)
2024年4月3日
算子量化精度验证技术
摘要: 算子量化精度验证技术
阅读全文
posted @ 2024-04-03 04:10 吴建明wujianming
阅读(26)
评论(0)
推荐(0)
上一页
1
···
112
113
114
115
116
117
118
119
120
···
371
下一页
公告