上一页 1 ··· 312 313 314 315 316 317 318 319 320 ··· 367 下一页
摘要: 编译器架构设计 Compiler Design – Architecture 根据编译方式,编译器大致可以分为两个阶段。 Analysis Phase 作为编译器的前端,编译器的分析阶段读取源程序,将其划分为核心部分,然后检查词法、语法和语法错误分析阶段生成源程序和符号表的中间表示,应将其作为输入馈 阅读全文
posted @ 2020-06-23 13:42 吴建明wujianming 阅读(698) 评论(0) 推荐(0)
摘要: NVIDIA安培架构 NVIDIA Ampere Architecture In-Depth 在2020年英伟达GTC主题演讲中,英伟达创始人兼首席执行官黄仁勋介绍了基于新英伟达安培GPU架构的新英伟达A100 GPU。本文将介绍新的A100 GPU,并描述NVIDIA安培体系结构GPU的重要新功能 阅读全文
posted @ 2020-06-23 10:14 吴建明wujianming 阅读(2833) 评论(0) 推荐(0)
摘要: CUDA 11功能展示 CUDA 11 Features Revealed 新的NVIDIA A100 GPU基于NVIDIA安培GPU架构,实现了加速计算的最大一代飞跃。A100 GPU具有革命性的硬件功能,我们很高兴宣布CUDA11与A100结合使用。 CUDA11使您能够利用新的硬件功能来加速 阅读全文
posted @ 2020-06-23 08:16 吴建明wujianming 阅读(4272) 评论(0) 推荐(0)
摘要: 将深度学习低延迟推理性能提高一倍 JetPack 3.1 Doubles Jetson’s Low-Latency Inference Performance NVIDIA发布了JetPack 3.1,这是Jetson TX1和TX2的生产Linux软件版本。通过对TensorRT 2.1和cuDN 阅读全文
posted @ 2020-06-22 14:36 吴建明wujianming 阅读(633) 评论(0) 推荐(0)
摘要: TensorRT 3:更快的TensorFlow推理和Volta支持 TensorRT 3: Faster TensorFlow Inference and Volta Support 英伟达TensorRT ™ 是一个高性能的深度学习推理优化器和运行时,为深度学习应用程序提供低延迟、高吞吐量的推理 阅读全文
posted @ 2020-06-22 13:12 吴建明wujianming 阅读(1005) 评论(0) 推荐(0)
摘要: 低层级GPU虚拟内存管理引论 Introducing Low-Level GPU Virtual Memory Management CUDA应用程序越来越需要尽可能快速高效地管理内存。在CUDA 10.2之前,开发人员可用的选项数量仅限于CUDA提供的类似malloc的抽象。 CUDA10.2为虚 阅读全文
posted @ 2020-06-22 11:19 吴建明wujianming 阅读(1035) 评论(0) 推荐(0)
摘要: 将HLSL射线追踪到Vulkan Bringing HLSL Ray Tracing to Vulkan Vulkan标志 DirectX光线跟踪(DXR)允许您使用光线跟踪而不是传统的光栅化方法渲染图形。这个API是NVIDIA和微软在2018年创建的。 几个月后,NVIDIA发布了其Turing 阅读全文
posted @ 2020-06-22 09:36 吴建明wujianming 阅读(640) 评论(0) 推荐(0)
摘要: 10分钟内基于gpu的目标检测 Object Detection on GPUs in 10 Minutes 目标检测仍然是自动驾驶和智能视频分析等应用的主要驱动力。目标检测应用程序需要使用大量数据集进行大量训练,以实现高精度。NVIDIA gpu在训练大型网络以生成用于对象检测推断的数据集所需的并 阅读全文
posted @ 2020-06-22 08:39 吴建明wujianming 阅读(896) 评论(0) 推荐(0)
摘要: 基于TensorRT车辆实时推理优化 Optimizing NVIDIA TensorRT Conversion for Real-time Inference on Autonomous Vehicles 自动驾驶系统使用各种神经网络模型,这些模型要求在GPU上进行极其精确和高效的计算。Zoox是 阅读全文
posted @ 2020-06-22 06:47 吴建明wujianming 阅读(439) 评论(0) 推荐(0)
摘要: 视频系列:RTX实时射线追踪(下) Key things from part 4 光线有效载荷是从一个着色器传递到另一个着色器的结构。 这一切都发生在RTX的引擎下。 更小的有效载荷要好得多! 新的DirectX编译器允许您为着色器提供语义。 您可以同时编译多个着色器,并且仍然知道哪些着色器对哪些用 阅读全文
posted @ 2020-06-21 17:35 吴建明wujianming 阅读(323) 评论(0) 推荐(0)
上一页 1 ··· 312 313 314 315 316 317 318 319 320 ··· 367 下一页