摘要: 开始 确保已经下载libzmq和cppzmq。快速安装教程:https://blog.csdn.net/lianshaohua/article/details/109384444 以下的代码编译,可以参考 编译指南 章节 zmq的通讯模式 示例一 hello world 进程间通信示例,进程有主线程 阅读全文
posted @ 2025-12-16 14:53 北纬31是条纬线哦 阅读(22) 评论(0) 推荐(0)
摘要: 系统信息 cat /etc/system-release # 检查系统发布信息 cat /etc/os-release # 检查操作系统信息 date # 查看日期时间 sudo groupadd username # 添加用户 sudo useradd -g usergroup -m userna 阅读全文
posted @ 2025-12-16 09:16 北纬31是条纬线哦 阅读(6) 评论(0) 推荐(0)
摘要: 编译器设计者的工作不仅会影响到他们创建的编译器,还会影响到他们所创建的编译器所编译的全部程序。这种杠杆作用使得编译器设计的回报丰厚,但也使得编译器的开发工作具有挑战性。 基础 语言处理器:1. 编译器 compiler 2. 解释器 interpreter 1. 编译器:阅读源语言编写的程序,并把该 阅读全文
posted @ 2025-12-16 00:26 北纬31是条纬线哦 阅读(3) 评论(0) 推荐(0)
摘要: C++的关键字 1. new 和 malloc 的区别 在C++中,new和malloc是两种不同的内存分配方式,它们之间有几个主要区别: 语法和类型安全: new是C++的关键字,用于动态分配内存,并且可以自动调用构造函数来初始化对象。它返回一个指向正确类型的指针。 malloc是C语言的标准库函 阅读全文
posted @ 2025-12-15 21:13 北纬31是条纬线哦 阅读(4) 评论(0) 推荐(0)
摘要: 在编写 CUDA 的 C++ 程序时,NVIDIA 的库文件中包含一行asm代码,这行代码在 NVIDIA的编译器 nvcc 编译时可以正常通过,但迁移到 AMD 的编译器中将无法识别,生成报错。为了编译通过进行后续性能测试,使用该方法实现asm内联汇编语句的替换。 阅读全文
posted @ 2024-09-18 17:15 北纬31是条纬线哦 阅读(260) 评论(0) 推荐(1)
摘要: CUDA的研发以及在当下的流行,从始至终都在完成提升性能这一件事。从这一套学习方案中,你会时刻感受到性能指标在编写CUDA程序中所占据的考量有多重。因此要编写出更加成熟的kernel程序,可以跟着我梳理出的学习流程一步一步掌握基础知识,侧重于对性能指标的提升,将CUDA最开始的初衷运用到你的代码之中。 阅读全文
posted @ 2024-08-10 22:49 北纬31是条纬线哦 阅读(489) 评论(0) 推荐(0)
摘要: CK 库是为 AMD-GPU 所开发的可组合内核库, 包含很多优化过的 kernel 代码用例,在Rocm平台下可以借助它高效、准确地编写并行 Kernel 程序,因此 CK 也称加速库。关于CK的下载、安装教程,以及原文链接,请阅读全文。 阅读全文
posted @ 2024-08-09 11:38 北纬31是条纬线哦 阅读(175) 评论(0) 推荐(0)
摘要: Bandwidth Test 是AMD公司Rocm环境下的带宽测试工具,用于测试AMD-GPU的带宽性能,可作为 kernel 进行性能评估的参考,便于计算GPU占用率、带宽峰值和实际带宽比。 阅读全文
posted @ 2024-08-07 14:43 北纬31是条纬线哦 阅读(225) 评论(0) 推荐(0)
摘要: Omniperf 是AMD公司GPU架构的性能测试软件,本文介绍了Omniperf 的下载,安装和使用教程,以便读者使用。 阅读全文
posted @ 2024-08-06 01:26 北纬31是条纬线哦 阅读(148) 评论(0) 推荐(0)