随笔分类 -  高性能计算

由于学习高性能计算有一段时间了,所以现在只能凭印象来整理笔记...
摘要:AlphaTensor论文阅读分析 目前只是大概了解了AlphaTensor的思路和效果,还在不断完善中.... deepmind博客在 https://www.deepmind.com/blog/discovering-novel-algorithms-with-alphatensor 论文是 h 阅读全文
posted @ 2022-10-19 15:38 BLMontgomery 阅读(837) 评论(0) 推荐(0)
摘要:奇偶排序 odd-even-sort, using MPI 代码在 https://github.com/thkkk/odd-even-sort 使用 MPI 实现奇偶排序算法, 并且 MPI 进程 只能向其相邻进程发送消息 nprocs 是进程数。 每个进程拥有独立的一块数据 data[0 ~ b 阅读全文
posted @ 2021-08-19 21:48 BLMontgomery 阅读(1899) 评论(0) 推荐(2)
摘要:cudaMemcpy有四种类型:HostToHost, DeviceToHost, HostToDevice, DeviceToDevices 现在我有两个指针:h_ptr, d_ptr,分别指向host端某数组的起始位置,和device端数组的起始位置。num是h_ptr数组的大小,一开始只有ho 阅读全文
posted @ 2021-06-29 11:01 BLMontgomery 阅读(1539) 评论(0) 推荐(0)