上一页 1 ··· 259 260 261 262 263 264 265 266 267 ··· 367 下一页
摘要: 6. 杂项说明 6.1. warp级原语 warp作为执行的原始单元(自然位于线程和块之间),重要性对CUDA程序员显而易见。从SM 1.x开始,NVIDIA开始添加专门针对thread的指令。 Vote CUDA体系结构是32位的,并且warp由32个线程组成,这些线程与评估条件,向warp中的每 阅读全文
posted @ 2021-01-06 07:44 吴建明wujianming 阅读(472) 评论(0) 推荐(0)
摘要: GPU编程和流式多处理器(六) 5. 纹理和表面 读取和写入纹理和表面的指令,所引用的隐式状态,比其他指令要多得多。header中包含诸如基地址,尺寸,格式和纹理内容的解释之类的参数,该header是一种中间数据结构,其软件抽象称为纹理参考或表面参考。当开发人员操纵纹理或表面引用时,CUDA运行时r 阅读全文
posted @ 2021-01-06 06:32 吴建明wujianming 阅读(108) 评论(0) 推荐(0)
摘要: GPU编程和流式多处理器(五) 4. 条件代码 硬件实现了“条件代码”或CC寄存器,其中包含用于整数比较的常用4位状态向量(符号,进位,零,溢出)。可以使用比较指令(例如ISET)来设置这些CC寄存器,并且它们可以通过谓词或发散来指导执行流程。预测允许(或禁止)在warp内基于每个线程执行指令,而分 阅读全文
posted @ 2021-01-06 06:20 吴建明wujianming 阅读(283) 评论(0) 推荐(0)
摘要: GPU编程和流式多处理器(四) 3.2. 单精度(32位) 单精度浮点支持是GPU计算的主力军。GPU已经过优化,可以在此数据类型上原生提供高性能,不仅适用于核心标准IEEE操作(例如加法和乘法),还适用于非标准操作(例如对先验的近似(例如sin()和log()))。32位值与整数保存在同一寄存器文 阅读全文
posted @ 2021-01-05 09:09 吴建明wujianming 阅读(465) 评论(0) 推荐(0)
摘要: GPU编程和流式多处理器(三) 3. Floating-Point Support 快速的本机浮点硬件是GPU的存在理由,并且在许多方面,它们在浮点实现方面都等于或优于CPU。全速支持异常可以根据每条指令指定直接舍入,特殊功能单元可为六种流行的单精度先验函数,提供高性能的近似函数。相比之下,x86 阅读全文
posted @ 2021-01-05 08:52 吴建明wujianming 阅读(665) 评论(0) 推荐(0)
摘要: GPU编程和流式多处理器(二) 2. 整数支持 SM具有32位整数运算的完整补充。 加法运算符的可选否定加法 乘法与乘法加法 整数除法 逻辑运算 条件码操作 to/from浮点转换 其它操作(例如,SIMD指令用于narrow整数,population人口计数,查找第一个零) CUDA通过标准C运算 阅读全文
posted @ 2021-01-05 07:34 吴建明wujianming 阅读(319) 评论(0) 推荐(0)
摘要: GPU编程和流式多处理器 流式多处理器(SM)是运行CUDA内核的GPU的一部分。本章重点介绍SM的指令集功能。 流式多处理器(SM)是运行我们的CUDA内核的GPU的一部分。每个SM包含以下内容。 可以在执行线程之间划分的数千个寄存器 几个缓存: –共享内存,用于线程之间的快速数据交换 –恒定高速 阅读全文
posted @ 2021-01-05 07:14 吴建明wujianming 阅读(1093) 评论(0) 推荐(0)
摘要: CloudHub概述 CloudHub CloudHub是cloudcore的一个模块,是Controller和Edge端之间的中转。它同时支持基于websocket的连接以及QUIC协议访问。Edgehub可以选择一种协议来访问cloudhub。CloudHub的功能是启用边端与控制器之间的通信。 阅读全文
posted @ 2021-01-05 06:20 吴建明wujianming 阅读(513) 评论(0) 推荐(0)
摘要: Kubeedge Edged概述 Overview EdgeD是管理节点生命周期的边缘节点模块。它可以帮助用户在边缘节点上部署容器化的工作负载或应用程序。这些工作负载可以执行任何操作,从简单的远程遥测数据操作到分析或ML推理等等。使用kubectl云端的命令行界面,用户可以发出命令来启动工作负载。 阅读全文
posted @ 2021-01-05 06:13 吴建明wujianming 阅读(398) 评论(0) 推荐(0)
摘要: 3D MinkowskiEngine稀疏模式重建 本文看一个简单的演示示例,该示例训练一个3D卷积神经网络,该网络用一个热点向量one-hot vector重构3D稀疏模式。这类似于Octree生成网络ICCV'17。输入的one-hot vector一热向量,来自ModelNet40数据集的3D计 阅读全文
posted @ 2021-01-04 08:21 吴建明wujianming 阅读(633) 评论(0) 推荐(0)
上一页 1 ··· 259 260 261 262 263 264 265 266 267 ··· 367 下一页