会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
专注于GPU的程序员
博客园
首页
新随笔
联系
订阅
管理
[置顶]
光栅化
摘要: 计算机中表示图形有两种方式,一种是点阵表示,一种是顶点表示。 左图,图形的顶点表示;右图,图形的点阵表示 点阵表示是光栅显示系统显示时所需要的表示形式,光栅化便是将顶点表示转换为点阵表示的过程。而点阵表示转换为顶点表示的过程属于图像识别的范畴,这里不做介绍。 什么是光栅显示?见下图。 (0, 0)(
阅读全文
posted @ 2020-07-22 18:33 专注于GPU的程序员
阅读(997)
评论(0)
推荐(0)
2024年8月6日
Hier-Z
摘要: 光栅化 --> Hier-Z --> Early-Z --> 片段着色 --> Late-Z Hier-Z 的全称是 Hierarchical Z Test,分层级的深度测试。 不分层级的深度测试,针对的是被覆盖的每个像素点的深度值; 分层级的深度测试,针对的是被覆盖的每个像素块的深度值最值。 类似
阅读全文
posted @ 2024-08-06 16:54 专注于GPU的程序员
阅读(31)
评论(0)
推荐(0)
2023年9月13日
透视投影矩阵的生成
摘要: 为何最新的OpenGL 看不到 gluPerspective API 最新版本的OpenGL(OpenGL 3.1及更高版本)中取消了对GLU(OpenGL Utility Library)的支持。GLU是一个辅助库,提供了一些便捷的函数和工具函数,用于简化OpenGL编程过程。其中包括 gluPe
阅读全文
posted @ 2023-09-13 09:06 专注于GPU的程序员
阅读(211)
评论(0)
推荐(0)
2022年8月19日
Windows + Visual Studio + SystemC
摘要: 期望在 Windows 操作系统上,使用 Visual Studio 集成开发环境,开发 SystemC 程序。开发环境搭建步骤如下, 下载并解压 SystemC 安装包。链接:https://www.accellera.org/images/downloads/standards/systemc/
阅读全文
posted @ 2022-08-19 15:27 专注于GPU的程序员
阅读(619)
评论(0)
推荐(1)
2022年7月21日
分块渲染
摘要: 介绍 Tile based rendering,分块渲染。 通过阅读本文,你将知道, 什么是 Tile based rendering Tile based rendering 相较于 Immediate rendering 的优缺点有哪些 渲染 在介绍分块渲染之前,先介绍一下什么是渲染。 如上图,
阅读全文
posted @ 2022-07-21 14:39 专注于GPU的程序员
阅读(788)
评论(0)
推荐(0)
2022年7月19日
牛人博客
摘要: 【C/C++】Johny's Software Lab Welcome to Johny’s Software Lab, a blog for all interested in fast software written in C and C++. 【综合】FindHao 科研工作者的自白 【GP
阅读全文
posted @ 2022-07-19 15:39 专注于GPU的程序员
阅读(67)
评论(0)
推荐(0)
基本模型
摘要: Roofline 模型 Roof-line Model 解决的,是“计算量为A且访存量为B的模型在算力为C且带宽为D的计算平台所能达到的理论性能上限E是多少”这个问题。 参考资料 Roofline Model与深度学习模型的性能分析 NVIDIA - Nsight Compute - Rooflin
阅读全文
posted @ 2022-07-19 15:14 专注于GPU的程序员
阅读(109)
评论(0)
推荐(0)
2022年5月18日
cmake 找不到头文件
摘要: 场景:使用 cmake 产生一个库 别人使用这个库的时候,需要使用到的是 xxx.so 和 头文件, 因此,在这个库的 CMakeLists.txt 中需要使用 cmake 的语法指定哪一部分的头文件是需要暴露给这个库的使用者的 指定的语法为:$<INSTALL_INTERFACE:xxx> 问题:
阅读全文
posted @ 2022-05-18 10:22 专注于GPU的程序员
阅读(1266)
评论(0)
推荐(0)
2022年5月6日
SystemC事务级建模01之最简单的模块间数据传输
摘要: 现在来看一个非常简单的情形:CPU传输数据给GPU。我们使用SystemC来对该情形进行事务级的建模。 CPU是事务的发起者,GPU是事务的接收者。它们通过 Socket连接(注意,这里的Socket不是网络中的那个Socket)。事务发起者的Socket类型是simple_initiator_so
阅读全文
posted @ 2022-05-06 17:22 专注于GPU的程序员
阅读(810)
评论(0)
推荐(0)
2022年5月5日
VLIW vs 超标量
摘要: 相同点 一个时钟周期可以同时执行多条指令 不同点 VLIW 依靠编译器和程序员自身来决定哪些指令可以并行执行 硬件实现较简单 功能比较专一的专用处理器领域 超标量 靠硬件自身来决定哪些指令可以并行地执行 硬件实现较复杂 通用领域的高性能处理器
阅读全文
posted @ 2022-05-05 10:16 专注于GPU的程序员
阅读(154)
评论(0)
推荐(0)
Warp
摘要: 我们知道,NVIDIA的GPU中线程调度的基本单位是Warp,一个Warp包含32个线程。 Warp的出现是为了隐藏指令执行的时延。 假设执行指令如下, add r2, r0, r1 // r0 + r1 -> r2 add r5, r3, r4 // r3 + r4 -> r5 load r6 [
阅读全文
posted @ 2022-05-05 10:14 专注于GPU的程序员
阅读(1708)
评论(0)
推荐(0)
下一页
公告