GPU驱动和编程模型

N 卡

cuda 和 nivdia 驱动

CUDA是一种并行计算平台和编程模型,用于在GPU上运行高性能计算应用程序。CUDA深度学习框架是建立在CUDA平台之上的深度学习框架,其中包括:
TensorFlow:由Google开发的开源深度学习框架,支持CPU和GPU加速。TensorFlow使用CUDA作为其GPU加速后端,可以在NVIDIA GPU上进行高效的深度学习计算。
PyTorch:由Facebook开发的开源深度学习框架,支持CPU和GPU加速。PyTorch也使用CUDA作为其GPU加速后端,可以在NVIDIA GPU上进行高效的深度学习计算。
Caffe:由Berkeley Vision and Learning Center开发的开源深度学习框架,支持CPU和GPU加速。Caffe使用CUDA作为其GPU加速后端,可以在NVIDIA GPU上进行高效的深度学习计算。
MXNet:由Apache开发的开源深度学习框架,支持CPU和GPU加速。MXNet使用CUDA作为其GPU加速后端,可以在NVIDIA GPU上进行高效的深度学习计算。

总之,CUDA深度学习框架提供了高效的GPU加速计算,可以大大加快深度学习模型的训练和推理速度。CUDA安装需要确保安装了对应的驱动
image

pyTotch

pyTorch 安装时会指定cuda 版本。但是安装包编译时已经打包了相关的依赖。不管你的主机是否装了cuda 都是可以正常使用的。但请你一定要装好对应的显卡驱动

A卡 AMD

云厂商基本不常见,虚拟化支持力度不大

其他显卡类型

FPGA(Field Programmable Gate Array)是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

Xilinx

ilinx VU9P是由Xilinx制造的可编程逻辑门阵列(FPGA)。它是Virtex UltraScale+系列的一部分,目前是市场上最大的FPGA,拥有超过250万个逻辑单元和高达1.5太比特每秒的串行I/O带宽。它专为高性能应用而设计,例如数据中心、网络、无线通信和视频处理。VU9P FPGA还具有先进的电源管理和安全功能,以确保可靠和安全的操作。

NETINT

NETINT T408是一种高性能视频编码器,由NETINT Technologies Inc.生产。它是一款基于FPGA的编码器,专为视频处理和云计算应用而设计。T408采用了新一代视频编码标准HEVC(H.265)和AV1,能够提供高效的视频压缩和传输,同时保持高质量的图像。它支持4K和8K分辨率,以及多种视频流格式和协议。T408还具有低延迟和高吞吐量的特点,适用于实时视频流处理和云视频服务。

其他编程模型

除了CUDA之外,还有其他的编程模型可以支持GPU加速,例如:
OpenACC:开放式加速器计算标准,支持GPU加速,可以在C、C++和Fortran等语言中使用。
OpenMP:共享内存多线程编程接口,可以在多核CPU和GPU上实现并行计算。
OpenCL:开放式并行计算标准,支持GPU加速,可以在多种硬件平台和操作系统中使用。
SYCL:基于OpenCL的高级编程接口,可以在C++中实现GPU加速计算。
ArrayFire:一个开源的GPU加速计算库,支持多种编程语言,包括C、C++、Python和Java等。
ROmc: AMD 显卡

总之,除了CUDA之外,还有许多其他的编程模型可以支持GPU加速,开发者可以根据自己的需求和实际情况选择合适的编程模型。

posted @ 2023-06-15 10:36  萱乐庆foreverlove  阅读(84)  评论(0编辑  收藏  举报