吴建明wujianming

2021年1月6日

摘要： 6. 杂项说明 6.1. warp级原语 warp作为执行的原始单元（自然位于线程和块之间），重要性对CUDA程序员显而易见。从SM 1.x开始，NVIDIA开始添加专门针对thread的指令。 Vote CUDA体系结构是32位的，并且warp由32个线程组成，这些线程与评估条件，向warp中的每阅读全文

posted @ 2021-01-06 07:44 吴建明wujianming 阅读(472) 评论(0) 推荐(0)

GPU编程和流式多处理器（六）

摘要： GPU编程和流式多处理器（六） 5. 纹理和表面读取和写入纹理和表面的指令，所引用的隐式状态，比其他指令要多得多。header中包含诸如基地址，尺寸，格式和纹理内容的解释之类的参数，该header是一种中间数据结构，其软件抽象称为纹理参考或表面参考。当开发人员操纵纹理或表面引用时，CUDA运行时r 阅读全文

posted @ 2021-01-06 06:32 吴建明wujianming 阅读(108) 评论(0) 推荐(0)

GPU编程和流式多处理器（五）

摘要： GPU编程和流式多处理器（五） 4. 条件代码硬件实现了“条件代码”或CC寄存器，其中包含用于整数比较的常用4位状态向量（符号，进位，零，溢出）。可以使用比较指令（例如ISET）来设置这些CC寄存器，并且它们可以通过谓词或发散来指导执行流程。预测允许（或禁止）在warp内基于每个线程执行指令，而分阅读全文

posted @ 2021-01-06 06:20 吴建明wujianming 阅读(283) 评论(0) 推荐(0)

2021年1月5日

GPU编程和流式多处理器（四）

摘要： GPU编程和流式多处理器（四） 3.2. 单精度（32位）单精度浮点支持是GPU计算的主力军。GPU已经过优化，可以在此数据类型上原生提供高性能，不仅适用于核心标准IEEE操作（例如加法和乘法），还适用于非标准操作（例如对先验的近似（例如sin（）和log（）））。32位值与整数保存在同一寄存器文阅读全文

posted @ 2021-01-05 09:09 吴建明wujianming 阅读(465) 评论(0) 推荐(0)

GPU编程和流式多处理器（三）

摘要： GPU编程和流式多处理器（三） 3. Floating-Point Support 快速的本机浮点硬件是GPU的存在理由，并且在许多方面，它们在浮点实现方面都等于或优于CPU。全速支持异常可以根据每条指令指定直接舍入，特殊功能单元可为六种流行的单精度先验函数，提供高性能的近似函数。相比之下，x86 阅读全文

posted @ 2021-01-05 08:52 吴建明wujianming 阅读(665) 评论(0) 推荐(0)

GPU编程和流式多处理器（二）

摘要： GPU编程和流式多处理器（二） 2. 整数支持 SM具有32位整数运算的完整补充。加法运算符的可选否定加法乘法与乘法加法整数除法逻辑运算条件码操作 to/from浮点转换其它操作（例如，SIMD指令用于narrow整数，population人口计数，查找第一个零） CUDA通过标准C运算阅读全文

posted @ 2021-01-05 07:34 吴建明wujianming 阅读(319) 评论(0) 推荐(0)

GPU编程和流式多处理器

摘要： GPU编程和流式多处理器流式多处理器（SM）是运行CUDA内核的GPU的一部分。本章重点介绍SM的指令集功能。流式多处理器（SM）是运行我们的CUDA内核的GPU的一部分。每个SM包含以下内容。可以在执行线程之间划分的数千个寄存器几个缓存： –共享内存，用于线程之间的快速数据交换 –恒定高速阅读全文

posted @ 2021-01-05 07:14 吴建明wujianming 阅读(1093) 评论(0) 推荐(0)

CloudHub概述

摘要： CloudHub概述 CloudHub CloudHub是cloudcore的一个模块，是Controller和Edge端之间的中转。它同时支持基于websocket的连接以及QUIC协议访问。Edgehub可以选择一种协议来访问cloudhub。CloudHub的功能是启用边端与控制器之间的通信。阅读全文

posted @ 2021-01-05 06:20 吴建明wujianming 阅读(513) 评论(0) 推荐(0)

Kubeedge Edged概述

摘要： Kubeedge Edged概述 Overview EdgeD是管理节点生命周期的边缘节点模块。它可以帮助用户在边缘节点上部署容器化的工作负载或应用程序。这些工作负载可以执行任何操作，从简单的远程遥测数据操作到分析或ML推理等等。使用kubectl云端的命令行界面，用户可以发出命令来启动工作负载。阅读全文

posted @ 2021-01-05 06:13 吴建明wujianming 阅读(398) 评论(0) 推荐(0)

2021年1月4日

3D MinkowskiEngine稀疏模式重建

摘要： 3D MinkowskiEngine稀疏模式重建本文看一个简单的演示示例，该示例训练一个3D卷积神经网络，该网络用一个热点向量one-hot vector重构3D稀疏模式。这类似于Octree生成网络ICCV'17。输入的one-hot vector一热向量，来自ModelNet40数据集的3D计阅读全文

posted @ 2021-01-04 08:21 吴建明wujianming 阅读(633) 评论(0) 推荐(0)

吴建明

微信视频号：sph0RgSyDYV47z6 快手号：4874645212 抖音号：dy0so323fq2w 小红书号：95619019828 B站1：UID:3546863642871878 B站2：UID: 3546955410049087

公告