04 2022 档案
摘要:calling convention Entry sequence (the function prologue) a few instructions at the beginning of a function, which prepare the stack and registers for
阅读全文
摘要:例子 例如需要编译cu时,需要-lcudart,编译命令中要加入 -L/data/cuda/cuda-10.2/cuda/lib64 -lcudart 编译成功: 如果去掉-L/data/cuda/cuda-10.2/cuda/lib64 这是因为没有在默认的动态链接库目录中找到cudart.so
阅读全文
摘要:# profiler ### nvprof 最早期的profiler,只提供cli ### nvvp 进化版本的nvprof,提供了gui ### ncu 写这个记录的时候,cuda已经不再支持nvprof,nvvp也变得异常难用(因为很多功能,比如metrics,去掉了)。现在推荐用nsight
阅读全文