摘要:
Profiler 工具有很多术语和指标,这里进行介绍、说明和总结。 Retired & Executed 指令 处理器执行的指令数量,往往会比程序流需要的指令数量要多。这是因为处理器会预测指令(分支预测等)。对于一般的指令,CPU 提交计算结果后就会 Retired(指令退役)。但是,处理器预测出来 阅读全文
posted @ 2022-05-29 15:29
PcDack
阅读(946)
评论(0)
推荐(0)
浅谈软件性能提升相关的概念 原文链接为<Making your program run faster: the key concepts of software performance - Johny's Software Lab> 所有的工程师在其职业生涯的某个阶段都不得不处理软件性能问题——让程 阅读全文
译者注:原文<How branches influence the performance of your code and what can you do about it?> 这是关于底层优化的第三篇文章,前面两篇为: 缓存友好程序设计指南 函数代价与优化 我们已经涵盖了与数据缓存和函数调用优化 阅读全文
通过使用数据缓存加速程序 译者注:本文原始链接为<Make your programs run faster by better using the data cache>,翻译获得作者同意。本文中的一些策略只对大量数据处理有优化的可能,小量数据很可能带来性能下降。 通过使用数据缓存加速程序 开发者 阅读全文
Roofline模型原理 Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度(Operational Intensity)下能够达到的理论计算上限 。论文和基础理论和应用 Roofline Model与深度学习模型的性能分析 。本文旨在教授如何根据当前开发环境机器建 阅读全文
DPC++ Compiler build to support nvidia cards 阅读全文