上一页 1 ··· 311 312 313 314 315 316 317 318 319 ··· 400 下一页
摘要: 使用TensorRT集成推理inference 使用TensorRT集成进行推理测试。 使用ResNet50模型对每个GPU进行推理,并对其它模型进行性能比较,最后与其它服务器进行比较测试。 ResNet-50 Inference performance: Throughput vs Batch s 阅读全文
posted @ 2020-11-28 09:44 吴建明wujianming 阅读(1122) 评论(0) 推荐(0)
摘要: Abstract 本cuDNN 8.0.4开发人员指南概述了cuDNN功能,如可自定义的数据布局、支持灵活的dimension ordering,striding,4D张量的子区域,这些张量用作其所有例程的输入和输出。这种灵活性可简单集成到任何神经网络实现中。 要访问cuDNN API参考,请参阅c 阅读全文
posted @ 2020-11-28 09:04 吴建明wujianming 阅读(2193) 评论(0) 推荐(1)
摘要: TVM源码框架安装方法 本文提供如何在各种系统上从零构建和安装TVM包的说明。它包括两个步骤: 首先从C++代码中构建共享库(linux的libtvm.so,macOS的libtvm.dylib和windows的libtvm.dll)。 编程语言包的设置(例如Python包)。 实现,请从下载页面下 阅读全文
posted @ 2020-11-28 07:06 吴建明wujianming 阅读(827) 评论(0) 推荐(0)
摘要: 在OpenShift平台上验证NVIDIA DGX系统的分布式多节点自动驾驶AI训练 自动驾驶汽车的深度神经网络(DNN)开发是一项艰巨的工作。本文验证了DGX多节点,多GPU,分布式训练在DXC机器人驱动环境中运行。 还使用了一个机器人学习平台来驱动深度学习(11.3)的工作负载。目前,OpenS 阅读全文
posted @ 2020-11-23 09:02 吴建明wujianming 阅读(672) 评论(0) 推荐(0)
摘要: NVIDIA DRIVE AGX开发工具包 英伟达drive™ AGX开发工具包提供了开发生产级自主车辆(AV)所需的硬件、软件和示例应用程序。NVIDIA DRIVE AGX系统建立在汽车产品级芯片上,具有开放的软件框架,并拥有大量汽车合作伙伴(包括产品级传感器供应商、汽车1级供应商)可供选择。 阅读全文
posted @ 2020-11-23 08:13 吴建明wujianming 阅读(829) 评论(0) 推荐(0)
摘要: 大数据目标检测推理管道部署 本文提供了一个用于对象检测的深度学习推理的概述。 自主车辆软件开发需要大规模的数据、计算和算法创新,这些都是gpu实现的。一组神经网络构成了感知和决策系统的基础。神经网络的性能与数据量成比例地增加,并且需要基础设施来支持大规模的训练和推理。 为了使自动驾驶汽车(AV)达到 阅读全文
posted @ 2020-11-23 07:51 吴建明wujianming 阅读(262) 评论(0) 推荐(0)
摘要: 随着2020年的发展,远程工作解决方案已成为许多人的新常态。企业正在寻找行之有效的解决方案,如虚拟桌面基础设施(VDI),以使他们的团队能够在任何地方安全地工作。然而,最新的算力和视频会议应用程序需要更强大的台式机来确保良好的用户体验。 借助NVIDIA GRID vPC,它可以经济高效地将虚拟化扩 阅读全文
posted @ 2020-11-21 12:04 吴建明wujianming 阅读(449) 评论(0) 推荐(0)
摘要: 使用NVIDIA A100 TF32获得即时加速 NVIDIA A100带来了我们公司历史上最大的单代性能增长。这是一个新的结构创新,这是一个多功能的支持,这是一个多功能的结构支持。TF32是用于深度学习训练的绝佳精度,因为它结合了FP32的范围和FP16的精度,与上一代的FP32精度相比,可提供高 阅读全文
posted @ 2020-11-21 11:25 吴建明wujianming 阅读(964) 评论(0) 推荐(0)
摘要: 使用PCAST检测散度以比较GPU和CPU结果 并行编译器辅助软件测试(PCAST)是英伟达HPC FORTRAN、C++和C编译器中的一个特性。PCAST有两个用例。一个新的处理器或新的编译程序的部分或新的时间标志首先被编译。您可能需要测试新库是否会产生相同的结果,或者测试添加OpenMP并行、启 阅读全文
posted @ 2020-11-21 10:52 吴建明wujianming 阅读(371) 评论(0) 推荐(0)
摘要: 用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用 编写高性能的软件不是一件简单的任务。当有了可以编译和运行的代码之后,当您尝试并理解它在可用硬件上的执行情况时,将引入一个新的挑战。不同的平台,无论是cpu、gpu还是其他平台,都会有不同的硬件限制,比如可用内存带 阅读全文
posted @ 2020-11-21 09:09 吴建明wujianming 阅读(1235) 评论(0) 推荐(0)
上一页 1 ··· 311 312 313 314 315 316 317 318 319 ··· 400 下一页