DoraCloud云桌面使用vGPU(二)

2 GPU的配置

2.1 NVIDIA vGPU方案的配置

从配置和使用角度,NVIDIA支持vGPU的显卡可以分为三类:

第一类:传统的支持虚拟化的GPU卡

这类显卡不带显示输出,也不支持 SR-IOV,直接安装vGPU驱动即可支持。对这类显卡,我们准备了gpu01.sh、gpu02.sh、gpu03.sh 三个脚本。 gpu01.sh 替换源,并更新pve。 gpu02.sh 启用iommu。gpu03.sh 安装 NVIDIA vGPU的Host层的驱动。

由于NVIDIA GPU的驱动经常升级,gpu03.sh安装的是当前的比较合适的驱动。如果希望其他版本驱动,可以参考这个脚本,下载其他版本的驱动安装。

配置成功的标志是:使用 mdevctl types ,可以查询到GPU虚拟化后支持的vGPU类型

第二类:支持SR-IOV的数据中心的GPU卡

这类显卡,不带有显示输出功能,或者默认不启用显示输出。但是SR-IOV的功能缺省是不启用的。

这类显卡如果需要启用vGPU,需要执行 sriov-manager命令,启用SR-IOV功能。

在安装好Proxmox VE 主机的NVIDIA 驱动后,根据显卡的PCI地址,执行sriov-manage激活SR-IOV功能。

/usr/lib/nvidia/sriov-manage -e 0000:af:00.0

或者使用 ALL 参数,激活所有显卡的SR-IOV功能。

/usr/lib/nvidia/sriov-manage -e ALL

之后如果使用 mdevctl types 查询到vGPU类型,即配置成功了。

第三类:支持SR-IOV的工作站的GPU卡

这类显卡用于工作站,显卡默认处于显示输出模式。这类显卡用于vGPU就比较复杂。比如A5000、A6000下卡配置步骤如下:

1)确保用于虚拟化的显卡没有被用于本地的显示输出

比如工作站默认使用核显输出。 或者有一个亮机卡,用于默认输出。用于虚拟化的显卡不能用于显示输出。记得修改BIOS,设置默认输出的显卡。也可以拆开机器,把用于虚拟化的显卡先拔出来。确保系统可以开机并正常显示。然后再关机,插入需要虚拟的显卡。

2)使用NVIDIA的displaymodeselector,设置工作模式为physical_display_disabled模式。

通过 ./displaymodeselector –gpumode 设置显卡模式为physical_display_disabled

如果GPU被用于当前显示,该命令可能导致主机黑屏,无法显示。

通过 ./displaymodeselector –listgpumodes 确认GPU的模式为 如下状态

root@test:~# ./displaymodeselector --listgpumodes

NVIDIA Display Mode Selector Utility (Version 1.48.0)
Copyright (C) 2015-2020, NVIDIA Corporation. All Rights Reserved.

Adapter: Graphics Device (10DE,2230,1028,1459) S:00,B:AF,D:00,F:00


EEPROM ID (EF,6015) : WBond W25Q16FW/JW 1.65-1.95V 16384Kx1S, page

GPU Mode: Graphics mode with physical display disabled
copy
  1. 使用 sriov-manage 激活 SR-IOV 功能。

最后使用 mdevctl types 命令查询vGPU类型。如果查询到了,就配置成功了。

配置NVIDIA 的GPU后,如果可以查询 mdevctl types,即可被DoraCloud发现并使用。

如果是在 PVE8平台下,可以配置Resouce Mapping。DoraCloud可以通过ResouceMapping管理vGPU。

如果集群中某个型号的GPU只有一种分割方式,可以不用定义ResouceMapping。如果一种型号的GPU需要有多种分割方式,需要为每种分割方式定义个ResouceMapping,这样才能有效管理GPU。

2.2 GPU直通方案的配置

DoraCloud支持GPU直通需要搭配Proxmox VE 8.0。

配置过程如下:

1)执行 Proxmox VE 的更新和升级

如下命令升级到 Proxmox VE 8.x 的最新版本。

curl -o- http://vdi.doracloud.cn:9000/software/pveupdate.sh |bash
copy

然后 reboot 重启。

2)在Proxmox VE 的Cluster中增加 Resource Mapping。

假设主机上有1个A4000,可以创建一个 Resource Mapping,内容如下

TBD ,RM 截图。

2.3 Intel SR-IOV GPU的的配置

针对Intel的核显vGPU,DoraCloud提供了 sriov01.sh,sriov2.sh

12代CPU i5-12400d的主机,安装Proxmox 7/8后,执行如下命令,等待重启。

curl -o- http://vdi.doracloud.cn:9000/software/sriov01.sh |bash 然后执行如下命令,等待自动重启。

curl -o- http://vdi.doracloud.cn:9000/software/sriov02.sh |bash 最后使用 lspci |grep VGA 验证 vGPU已经启用。

posted @ 2025-05-01 22:03  朵拉云  阅读(125)  评论(0)    收藏  举报