随笔分类 - 课程--操作系统 / Parallel Computing
摘要:
from pixiv Parallel Performance Metric 并行应用的的性能指标总的可以分为两大类: 效率:用于评估多线程程序的好坏,分析CPU真正的利用率 Effective CPU Utilization 可扩展性:用于评估性能随负载的变化而变化的情况 Amdahl’s Law
阅读全文

摘要:
from pixiv 杉8 基础知识 Transformer and Attention PPT:Efficiently Evaluating DNNs on GPUs 对应课程:Stanford CS149 I Parallel Computing I 2023 I Lecture 10 - Ef
阅读全文

摘要:
from pixiv 资料 并行计算(三):缓存一致性 Snooping-Based Cache Coherence 《内存一致性与缓存一致性》笔记(一):基础 基础知识 注意点 内存一致性的粒度为某个内存位置(如一个变量或一个字大小的数据) 缓存一致性的粒度为缓存行(cache line),所以这
阅读全文

摘要:
from pixiv GPU的编译 使用 nvcc 一步完成编译与链接 nvcc -o vector_add vector_add.cu nvcc 会自动将设备代码编译为 PTX/Cubin,调用主机编译器(如 g++)编译主机部分,并自动链接 CUDA 运行时库 cudart 等 或者分步编译与手
阅读全文

摘要:
from pixiv PART_A 这里我将重点对TaskSystemParallelThreadPoolSleeping的实现进行讨论。 这里实际上要求我们实现线程池,在此基础上我还实现了任务队列,当然对于这题实际上并不需要用任务队列来管理动态分配,使用了任务队列执行速度会有所下降 我参考的通用性
阅读全文

摘要:
from pixiv Parallel Programing Basics Creating a parallel program 并行加速比的下限:Amdahl’s Law(阿姆达尔定律) 并行程序的宏观思考过程可总结如下: 挖掘工作可并行的部分。 划分工作。 管理数据的方面,沟通,同步。 最初我
阅读全文

摘要:
from pixiv Assignment 1: Performance Analysis on a Quad-Core CPU Environment Setup CPU信息 Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Address s
阅读全文

摘要:
Why Parallelism?Why Efficiency? Why Parallelism? 因为单颗核(core)的处理器性能增长遇到了瓶颈,若想要继续提高处理器的性能,策略是在处理器中放更多的核(core)。 同时为了让应用程序更高效地执行,我们需要利用好处理器中的多核(core),即我们需
阅读全文

摘要:
from pixiv JW 资源汇总 前言 开新坑了,尽量完成它吧. 此篇博客为目录章节,主要汇总学习过程中用到的资料,记录时间线。 Source CS自学指南 CMU 15-418/Stanford CS149: Parallel Computing 了解此课程的主要起始地,下面的评论含有价值的信
阅读全文
