研途--性能分析 - 随笔分类 - 次林梦叶

Paper Reading ---- VESPA: Static Profiling for Binary Optimization：机器代码布局优化, Basic Block, CFG, 基于性能分析引导的优化（Profile Guided Optimizations）, The Basic Block Placement Problem (BBPP) ---- NP hard , DNN

摘要：

from pixiv Paper 什么是CFG? 在CFG中，“branch”指的就是程序在基本块（basic block）末尾的那条控制流分支指令（branch instruction），也就是说：它可以是条件分支（例如在汇编里常见的 BEQ、BNE、BLT 等，根据比较结果决定跳到哪儿）或者阅读全文

posted @ 2025-08-02 15:53 次林梦叶阅读(70) 评论(0) 推荐(0)

Paper Reading ---- QFlex 3.0: Fast and Accurate ARM Server Simulation | Knowledge Points：中心极限定理，正态分布，置信度，置信空间，抽样误差

摘要：

from pixiv from AGPC ’25 Simulator and Simulation QEMU 并不是一个 cycle‑accurate timing simulator，而是一个功能级（functional）ISA 模拟／动态二进制翻译（dynamic binary transla 阅读全文

posted @ 2025-07-29 19:42 次林梦叶阅读(37) 评论(0) 推荐(0)

性能分析 | Optimizing Multithreaded Applications

摘要：

from pixiv Parallel Performance Metric 并行应用的的性能指标总的可以分为两大类：效率：用于评估多线程程序的好坏，分析CPU真正的利用率 Effective CPU Utilization 可扩展性：用于评估性能随负载的变化而变化的情况 Amdahl’s Law 阅读全文

posted @ 2025-06-16 12:33 次林梦叶阅读(29) 评论(0) 推荐(0)

性能分析 | 评分法

摘要：

from pixiv 层次几何平均参考资料 Hierarchical Means: Single Number Benchmarking with Workload Cluster Analysis PowerPoint Presentation Self-organizing map Self- 阅读全文

posted @ 2025-04-28 17:23 次林梦叶阅读(43) 评论(0) 推荐(0)

性能测试 | 性能测试分析工具

摘要：

from pixiv Tracy Tracy 是一款实时、纳秒级分辨率的混合帧和采样剖析器，可用于远程或嵌入式遥测游戏和其他应用程序。它可以对 CPU（C、C++11、Lua）、GPU（OpenGL、Vulkan、Direct3D 11/12、OpenCL）和内存进行剖析。它还能监控线程所持有的锁，阅读全文

posted @ 2025-04-26 22:47 次林梦叶阅读(38) 评论(0) 推荐(0)

代码插桩化

摘要：

from pixiv 理论代码插桩化插桩所需的计时器软件和硬件定时器软件定时器：系统范围的高分辨率定时器如C++中的std::chrono 硬件定时器：时间戳计数器（TSC）：这是一种硬件定时器，实现为硬件寄存器。不同架构下（x86,arch64,riscv）获取时间戳计数器的方式可能不同阅读全文

posted @ 2025-04-26 13:14 次林梦叶阅读(117) 评论(0) 推荐(0)

性能分析 | 分支预测

摘要：

from pixiv 基础知识参考课本基本块我们如何确定程序控制流？我们基本上忽略基本块中的其他指令，因为分支总是基本块中的最后一个指令。由于基本块中的所有指令都保证执行一次，因此我们只能关注将“代表”整个基本块的分支。因此，如果我们跟踪每个分支的结果，就可以重建程序的整个逐行执行路径。阅读全文

posted @ 2025-04-06 16:17 次林梦叶阅读(60) 评论(0) 推荐(0)

性能分析 | Memory Bound

摘要：

from pixiv 基于LMbench测试LLC perf-book -- 内存延迟和带宽工具与术语 LLC延迟（Last Level Cache Latency）是指处理器访问最后一级缓存（通常是L3缓存）中的数据所需的时间延迟。 LMbench LMbench是Intel旗下的内存测试工具阅读全文

posted @ 2025-03-21 11:36 次林梦叶阅读(344) 评论(0) 推荐(1)

Linux 性能调优命令

摘要：

from pixiv ps ps auxf ps：显示系统中当前的进程信息。 a：显示与终端无关的所有进程（即显示所有用户的进程）。 u：以用户友好的格式显示进程信息，包括用户、CPU 和内存使用情况。 x：显示没有控制终端的进程，例如守护进程（daemon）。 f：以 ASCII 字符显示进程的树阅读全文

posted @ 2024-12-22 21:53 次林梦叶阅读(47) 评论(0) 推荐(0)

Perf Linux性能事件（性能计数）器与 Flame Graph

摘要：

from ふぃーる　冬コミ２日目西ふ１５性能分析基础知识 Benchmark Benchmarks are designed to mimic a particular type of workload on a component or system. 基准旨在模拟组件或系统上特定类型的工作负载阅读全文

posted @ 2024-11-24 23:14 次林梦叶阅读(862) 评论(0) 推荐(0)

CPU性能分析方法论

摘要：

from pixiv 前置知识指令流水线与分支预测指令流水线（英语：Instruction pipeline）是为了让计算机和其它数字电子设备能够加速指令的通过速度（单位时间内被执行的指令数量）而设计的技术。流水线在处理器的内部被组织成层级，各个层级的流水线能半独立地单独运作。每一个层级都被管阅读全文

posted @ 2024-11-14 21:54 次林梦叶阅读(664) 评论(0) 推荐(1)

次林梦叶的小屋

音无结弦之时

随笔分类 - 研途--性能分析

公告