上一页 1 2 3 4 5 6 ··· 9 下一页
摘要: 编写或生成 SVE 代码由几种方法: 编写 SVE 汇编代码; 使用 SVE intrinsics 进行编程; 自动向量化; 使用 SVE 优化的库。 下面我们将详细介绍这四种方法。 1. 编写 SVE 汇编代码 我们可以在 C/C++ 代码中以内联汇编形式编写 SVE 指令,或在汇编源文件中编写完 阅读全文
posted @ 2025-08-22 15:50 木杉的园子 阅读(126) 评论(0) 推荐(0)
摘要: ARM 可扩展向量扩展(Scalable Vector Extension,SVE)是继 Neon 之后的 SIMD 扩展。SVE 允许在 CPU 实现中采用灵活的向量长度,其取值范围可从最小 128 位至最大 2048 位,但必须是 2 的幂次。因此有效的向量长度实现为 128、256、512、1 阅读全文
posted @ 2025-08-22 15:48 木杉的园子 阅读(131) 评论(0) 推荐(0)
摘要: ARM 的 Neon、SVE 和 SME 架构都可以计算矩阵乘法,本篇博客将对比这三种架构。 本博客的编写参考了基于以下 ARM 社区文章: Part 1: Arm Scalable Matrix Extension (SME) Introduction Part 2: Arm Scalable M 阅读全文
posted @ 2025-08-16 02:40 木杉的园子 阅读(226) 评论(0) 推荐(0)
摘要: ARM SME 指令 与 SME ZA 存储交互的 SME 指令包括以下内容: 将两个向量的外积累加或减去到 ZA 矩阵分块的指令; 在 ZA 矩阵分块行/列与向量之间传输的 Load/Store/Move 指令; 将向量水平或垂直方向加到 ZA 矩阵分块的指令; 在流式 SVE 模式下将向量大小的 阅读全文
posted @ 2025-08-15 20:07 木杉的园子 阅读(168) 评论(0) 推荐(0)
摘要: ARM 可扩展矩阵扩展(Scalable Matrix Extension,SME),是用于增强矩阵运算的指令集扩展。SME 是建立在可扩展向量扩展(Scalable Vector Extension,SVE)上的,新增了处理矩阵的能力。主要特性包括: 两个向量之间的外积运算; 矩阵分块存储; 矩阵 阅读全文
posted @ 2025-08-15 19:38 木杉的园子 阅读(213) 评论(0) 推荐(0)
摘要: 早期全局预测器(如 GShare)只利用固定长度的历史模式,难以同时捕捉短期与长期相关性。随后出现的 O‑GEHL 用“几何级数”长度表来改善覆盖面,但仍缺少应对历史冲突的机制。而 TAGE 预测器则综合了 O‑GEHL 与 PPM-like 预测器的设计,可以获得更高的准确率与芯片面积效率。现代处 阅读全文
posted @ 2025-08-14 22:50 木杉的园子 阅读(148) 评论(0) 推荐(0)
摘要: 在现代计算机体系结构中,CPU 通常采用流水线方式执行指令以提升效率。然而,分支指令的存在会导致流水线停滞:CPU 无法提前知晓分支结果,因而难以预先获取并执行分支路径上正确的后续指令。 为解决这一问题,现代处理器普遍采用分支预测技术。当前主流的分支预测方法分为两类: 静态分支预测 静态分支预测基于 阅读全文
posted @ 2025-08-14 22:47 木杉的园子 阅读(139) 评论(0) 推荐(0)
摘要: 分支指令主要用于改变程序的执行流,如函数调用、循环和条件分支等。 基本分支指令 B <label> 无条件跳转到目标地址(偏移地址由立即数给出)。 BL <label> 将返回地址保存到链接寄存器 LR,然后无条件跳转到目标地址(偏移地址由立即数给出),常用于函数调用。 BLR <Xn> 将返回地址 阅读全文
posted @ 2025-08-08 17:06 木杉的园子 阅读(47) 评论(0) 推荐(0)
摘要: 本文将介绍 ARM 指令的基本概念,包括指令的编码格式、指令的条件码、指令的寻址方式等。 1. ARM 指令集分类 ARM32 指令字长固定为 32 位,其编码格式如下: 31...28 27...25 24...21 20 19...16 15...12 11...0 cond 001 opcod 阅读全文
posted @ 2025-08-08 17:01 木杉的园子 阅读(88) 评论(0) 推荐(0)
摘要: ARM,即 Advanced RISC Machines,是围绕精简指令集构建的一套处理器生态系统,包括指令集架构、处理器产品、嵌入式系统设计规范等内容。 1. ARM 指令集架构与处理器型号的命名 许多刚接触 ARM 的朋友可能会困扰于它们的指令集与处理器的命名,现在我们先来缕清其命名规则。 1. 阅读全文
posted @ 2025-08-08 16:59 木杉的园子 阅读(123) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 9 下一页