随笔分类 -  gpu

摘要:光栅化 --> Hier-Z --> Early-Z --> 片段着色 --> Late-Z Hier-Z 的全称是 Hierarchical Z Test,分层级的深度测试。 不分层级的深度测试,针对的是被覆盖的每个像素点的深度值; 分层级的深度测试,针对的是被覆盖的每个像素块的深度值最值。 类似 阅读全文
posted @ 2024-08-06 16:54 专注于GPU的程序员 阅读(36) 评论(0) 推荐(0)
摘要:我们知道,NVIDIA的GPU中线程调度的基本单位是Warp,一个Warp包含32个线程。 Warp的出现是为了隐藏指令执行的时延。 假设执行指令如下, add r2, r0, r1 // r0 + r1 -> r2 add r5, r3, r4 // r3 + r4 -> r5 load r6 [ 阅读全文
posted @ 2022-05-05 10:14 专注于GPU的程序员 阅读(1721) 评论(0) 推荐(0)
摘要:处理器的执行流水线通常分为5个阶段,分别为:取指、译码、访存、执行和写回。这里的访存指的是访问寄存器。 假设每个阶段只占用一个时钟周期,那么这个5级流水线的处理器每个时钟周期可以执行一条指令。如下图, 如果前一条指令的目的寄存器是当前指令的源寄存器,如: add r2, r0, r1 // r0 + 阅读全文
posted @ 2022-05-05 09:26 专注于GPU的程序员 阅读(391) 评论(0) 推荐(0)
摘要:Cache的介绍可以参看这篇文章:计算机缓存Cache以及Cache Line详解 一般 Cache Line 的大小设置和硬件一次突发传输的大小有关系。 比如,GPU 与显存的数据位宽是 64 比特,一次突发传输可以传输 8 个数据, 也就是说,一次突发传输可以传输 64 字节的数据, 那么, L 阅读全文
posted @ 2022-04-09 16:08 专注于GPU的程序员 阅读(801) 评论(0) 推荐(0)
摘要:Full-system RISCV-based GPU Vortex RISC-V GPGPU RV64X: A Free, Open Source GPU for RISC-V Pixilica LLC Sub-system RISCV-based GPU Imagination Announce 阅读全文
posted @ 2022-04-09 15:56 专注于GPU的程序员 阅读(289) 评论(0) 推荐(0)