随笔分类 - 研途--性能分析
摘要:
from pixiv Paper 什么是CFG? 在CFG中,“branch”指的就是程序在基本块(basic block)末尾的那条控制流分支指令(branch instruction),也就是说: 它可以是条件分支(例如在汇编里常见的 BEQ、BNE、BLT 等,根据比较结果决定跳到哪儿) 或者
阅读全文
from pixiv Paper 什么是CFG? 在CFG中,“branch”指的就是程序在基本块(basic block)末尾的那条控制流分支指令(branch instruction),也就是说: 它可以是条件分支(例如在汇编里常见的 BEQ、BNE、BLT 等,根据比较结果决定跳到哪儿) 或者
阅读全文
摘要:
from pixiv from AGPC ’25 Simulator and Simulation QEMU 并不是一个 cycle‑accurate timing simulator,而是一个 功能级(functional)ISA 模拟/动态二进制翻译(dynamic binary transla
阅读全文
from pixiv from AGPC ’25 Simulator and Simulation QEMU 并不是一个 cycle‑accurate timing simulator,而是一个 功能级(functional)ISA 模拟/动态二进制翻译(dynamic binary transla
阅读全文
摘要:
from pixiv Parallel Performance Metric 并行应用的的性能指标总的可以分为两大类: 效率:用于评估多线程程序的好坏,分析CPU真正的利用率 Effective CPU Utilization 可扩展性:用于评估性能随负载的变化而变化的情况 Amdahl’s Law
阅读全文
from pixiv Parallel Performance Metric 并行应用的的性能指标总的可以分为两大类: 效率:用于评估多线程程序的好坏,分析CPU真正的利用率 Effective CPU Utilization 可扩展性:用于评估性能随负载的变化而变化的情况 Amdahl’s Law
阅读全文
摘要:
from pixiv 层次几何平均 参考资料 Hierarchical Means: Single Number Benchmarking with Workload Cluster Analysis PowerPoint Presentation Self-organizing map Self-
阅读全文
from pixiv 层次几何平均 参考资料 Hierarchical Means: Single Number Benchmarking with Workload Cluster Analysis PowerPoint Presentation Self-organizing map Self-
阅读全文
摘要:
from pixiv Tracy Tracy 是一款实时、纳秒级分辨率的混合帧和采样剖析器,可用于远程或嵌入式遥测游戏和其他应用程序。它可以对 CPU(C、C++11、Lua)、GPU(OpenGL、Vulkan、Direct3D 11/12、OpenCL)和内存进行剖析。它还能监控线程所持有的锁,
阅读全文
from pixiv Tracy Tracy 是一款实时、纳秒级分辨率的混合帧和采样剖析器,可用于远程或嵌入式遥测游戏和其他应用程序。它可以对 CPU(C、C++11、Lua)、GPU(OpenGL、Vulkan、Direct3D 11/12、OpenCL)和内存进行剖析。它还能监控线程所持有的锁,
阅读全文
摘要:
from pixiv 理论 代码插桩化 插桩所需的计时器 软件和硬件定时器 软件定时器:系统范围的高分辨率定时器如C++中的std::chrono 硬件定时器:时间戳计数器(TSC):这是一种硬件定时器,实现为硬件寄存器。 不同架构下(x86,arch64,riscv)获取时间戳计数器的方式可能不同
阅读全文
from pixiv 理论 代码插桩化 插桩所需的计时器 软件和硬件定时器 软件定时器:系统范围的高分辨率定时器如C++中的std::chrono 硬件定时器:时间戳计数器(TSC):这是一种硬件定时器,实现为硬件寄存器。 不同架构下(x86,arch64,riscv)获取时间戳计数器的方式可能不同
阅读全文
摘要:
from pixiv 基础知识 参考课本 基本块 我们如何确定程序控制流? 我们基本上忽略基本块中的其他指令,因为分支总是基本块中的最后一个指令。 由于基本块中的所有指令都保证执行一次,因此我们只能关注将“代表”整个基本块的分支。因此,如果我们跟踪每个分支的结果,就可以重建程序的整个逐行执行路径。
阅读全文
from pixiv 基础知识 参考课本 基本块 我们如何确定程序控制流? 我们基本上忽略基本块中的其他指令,因为分支总是基本块中的最后一个指令。 由于基本块中的所有指令都保证执行一次,因此我们只能关注将“代表”整个基本块的分支。因此,如果我们跟踪每个分支的结果,就可以重建程序的整个逐行执行路径。
阅读全文
摘要:
from pixiv 基于LMbench测试LLC perf-book -- 内存延迟和带宽 工具与术语 LLC延迟(Last Level Cache Latency) 是指处理器访问最后一级缓存(通常是L3缓存)中的数据所需的时间延迟。 LMbench LMbench是Intel旗下的内存测试工具
阅读全文
from pixiv 基于LMbench测试LLC perf-book -- 内存延迟和带宽 工具与术语 LLC延迟(Last Level Cache Latency) 是指处理器访问最后一级缓存(通常是L3缓存)中的数据所需的时间延迟。 LMbench LMbench是Intel旗下的内存测试工具
阅读全文
摘要:
from pixiv ps ps auxf ps:显示系统中当前的进程信息。 a:显示与终端无关的所有进程(即显示所有用户的进程)。 u:以用户友好的格式显示进程信息,包括用户、CPU 和内存使用情况。 x:显示没有控制终端的进程,例如守护进程(daemon)。 f:以 ASCII 字符显示进程的树
阅读全文
from pixiv ps ps auxf ps:显示系统中当前的进程信息。 a:显示与终端无关的所有进程(即显示所有用户的进程)。 u:以用户友好的格式显示进程信息,包括用户、CPU 和内存使用情况。 x:显示没有控制终端的进程,例如守护进程(daemon)。 f:以 ASCII 字符显示进程的树
阅读全文
摘要:
from ふぃーる 冬コミ2日目西ふ15 性能分析基础知识 Benchmark Benchmarks are designed to mimic a particular type of workload on a component or system. 基准旨在模拟组件或系统上特定类型的工作负载
阅读全文
from ふぃーる 冬コミ2日目西ふ15 性能分析基础知识 Benchmark Benchmarks are designed to mimic a particular type of workload on a component or system. 基准旨在模拟组件或系统上特定类型的工作负载
阅读全文
摘要:
from pixiv 前置知识 指令流水线与分支预测 指令流水线(英语:Instruction pipeline)是为了让计算机和其它数字电子设备能够加速指令的通过速度(单位时间内被执行的指令数量)而设计的技术。 流水线在处理器的内部被组织成层级,各个层级的流水线能半独立地单独运作。每一个层级都被管
阅读全文
from pixiv 前置知识 指令流水线与分支预测 指令流水线(英语:Instruction pipeline)是为了让计算机和其它数字电子设备能够加速指令的通过速度(单位时间内被执行的指令数量)而设计的技术。 流水线在处理器的内部被组织成层级,各个层级的流水线能半独立地单独运作。每一个层级都被管
阅读全文

浙公网安备 33010602011771号