随笔分类 -  课程--操作系统 / Parallel Computing

摘要:性能分析 | Optimizing Multithreaded Applicationsfrom pixiv Parallel Performance Metric 并行应用的的性能指标总的可以分为两大类: 效率:用于评估多线程程序的好坏,分析CPU真正的利用率 Effective CPU Utilization 可扩展性:用于评估性能随负载的变化而变化的情况 Amdahl’s Law 阅读全文
posted @ 2025-06-16 12:33 次林梦叶 阅读(23) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | Assignment 4: cs149gpt and Lecture 10 - Efficiently Evaluating DNNs on GPUsfrom pixiv 杉8 基础知识 Transformer and Attention PPT:Efficiently Evaluating DNNs on GPUs 对应课程:Stanford CS149 I Parallel Computing I 2023 I Lecture 10 - Ef 阅读全文
posted @ 2025-05-31 19:25 次林梦叶 阅读(61) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | 缓存一致性from pixiv 资料 并行计算(三):缓存一致性 Snooping-Based Cache Coherence 《内存一致性与缓存一致性》笔记(一):基础 基础知识 注意点 内存一致性的粒度为某个内存位置(如一个变量或一个字大小的数据) 缓存一致性的粒度为缓存行(cache line),所以这 阅读全文
posted @ 2025-05-19 22:44 次林梦叶 阅读(34) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | Assignment 3: A Simple CUDA Rendererfrom pixiv GPU的编译 使用 nvcc 一步完成编译与链接 nvcc -o vector_add vector_add.cu nvcc 会自动将设备代码编译为 PTX/Cubin,调用主机编译器(如 g++)编译主机部分,并自动链接 CUDA 运行时库 cudart 等 或者分步编译与手 阅读全文
posted @ 2025-05-13 17:05 次林梦叶 阅读(40) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | Assignment 2: Building A Task Execution Library from the Ground Upfrom pixiv PART_A 这里我将重点对TaskSystemParallelThreadPoolSleeping的实现进行讨论。 这里实际上要求我们实现线程池,在此基础上我还实现了任务队列,当然对于这题实际上并不需要用任务队列来管理动态分配,使用了任务队列执行速度会有所下降 我参考的通用性 阅读全文
posted @ 2025-04-14 17:25 次林梦叶 阅读(37) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | Parallel Programingfrom pixiv Parallel Programing Basics Creating a parallel program 并行加速比的下限:Amdahl’s Law(阿姆达尔定律) 并行程序的宏观思考过程可总结如下: 挖掘工作可并行的部分。 划分工作。 管理数据的方面,沟通,同步。 最初我 阅读全文
posted @ 2025-03-27 22:00 次林梦叶 阅读(65) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | Assignment 1: Performance Analysis on a Quad-Core CPUfrom pixiv Assignment 1: Performance Analysis on a Quad-Core CPU Environment Setup CPU信息 Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Address s 阅读全文
posted @ 2025-03-22 14:54 次林梦叶 阅读(77) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | CPU and GPUWhy Parallelism?Why Efficiency? Why Parallelism? 因为单颗核(core)的处理器性能增长遇到了瓶颈,若想要继续提高处理器的性能,策略是在处理器中放更多的核(core)。 同时为了让应用程序更高效地执行,我们需要利用好处理器中的多核(core),即我们需 阅读全文
posted @ 2025-03-01 17:03 次林梦叶 阅读(351) 评论(0) 推荐(0)
摘要:并行计算架构和编程 | 目录from pixiv JW 资源汇总 前言 开新坑了,尽量完成它吧. 此篇博客为目录章节,主要汇总学习过程中用到的资料,记录时间线。 Source CS自学指南 CMU 15-418/Stanford CS149: Parallel Computing 了解此课程的主要起始地,下面的评论含有价值的信 阅读全文
posted @ 2025-02-10 22:37 次林梦叶 阅读(43) 评论(0) 推荐(0)