1 2 3 4 5 ··· 9 下一页
摘要: Expressing Program Performance 在5-1章节中,我们提到过向量前置的计算问题,其中函数 psum2 使用了循环展开,就是每次迭代可以算出两个元素的值。这样一来,所需的迭代次数就可以减半。 void psum2() 阅读全文
posted @ 2025-06-26 10:54 松—松 阅读(20) 评论(0) 推荐(1)
摘要: # 阅读全文
posted @ 2025-06-26 10:52 松—松 阅读(5) 评论(0) 推荐(0)
摘要: 在 gem5/src/python/gem5/components/memory/dramsys.py 中给出统一DRAM interface, 主要解释 dramsys.hh、 dramsys.cc 的内容解析。 首先给出 dramsys 的代码: #ifndef __MEM_DRAMSYS_H_ 阅读全文
posted @ 2025-06-20 15:34 松—松 阅读(39) 评论(0) 推荐(0)
摘要: Processes(进程) 进程就是一个正在执行的程序实例,当我们在shell中输入一个可执行程序的名字后,然后按下回车键,此时shell就会创建一个新的进程,然后处理器运行这个可执行程序。我们现在主要关心的是进程提供给应用程序的抽象。在现代系统上运行一个程序时,我们会得到一个假象。好像是我们的程序 阅读全文
posted @ 2025-06-18 10:27 松—松 阅读(25) 评论(0) 推荐(0)
摘要: arch Device Control Register : 用来接收外部的设置,打开多少个threads来跑当前的kernel。 Dispatcher : 当一个kernel开始执行时,调度器会来确定会有多少个线程组来执行这个kernel。每个线程组叫block。每个线程组会被assign到一个可 阅读全文
posted @ 2025-05-28 19:42 松—松 阅读(20) 评论(0) 推荐(0)
摘要: The Lifetim of Hello Program 这一章主要是通过介绍 helloworld 这个程序的生命周期,对计算机系统的主要概念做了一个概述。 hello 程序的生命周期是从一个高级 C 语言程序开始的,因为这种形式能够被人读懂。然而,为了在系统上运行 hello.c 程序,每条 C 阅读全文
posted @ 2025-02-16 12:09 松—松 阅读(23) 评论(0) 推荐(0)
摘要: 开始学习CS的课程,感谢有大佬做了中文版的讲解。下面也先对cs这本书做一下简要梳理: Chapter1. A Tour of Computer System (计算机系统漫游) 第一章以'helloworld'程序的生命周期为线索,对计算机的主要系统概念做了一个整体的介绍。 Part I. Prog 阅读全文
posted @ 2025-02-10 21:11 松—松 阅读(20) 评论(0) 推荐(0)
摘要: 第十三章 拷贝控制 拷贝控制操作(copy control): 拷贝构造函数(copy constructor) 拷贝赋值运算符(copy-assignment operator) 移动构造函数(move constructor) 移动赋值函数(move-assignement operator) 阅读全文
posted @ 2025-01-22 17:23 松—松 阅读(27) 评论(0) 推荐(0)
摘要: NCCL 的原理 NCCL是专为NVIDIA GPU设计的集合通信库,它和 MPI 一样支持多种高效的集体通信操作,如广播、归约、全收集等。通信的实现方式分为两种类型:机器内通信与机器间通信。 机器内通信: GPU Direct Shared Memory(2010年6月引入):共享内存(QPI/U 阅读全文
posted @ 2025-01-06 17:52 松—松 阅读(632) 评论(0) 推荐(1)
摘要: reference 计算机体系结构:量化研究方法 阅读全文
posted @ 2025-01-04 15:24 松—松 阅读(16) 评论(0) 推荐(0)
1 2 3 4 5 ··· 9 下一页