DoraCloud云桌面使用vGPU(二)
2 GPU的配置
2.1 NVIDIA vGPU方案的配置
从配置和使用角度,NVIDIA支持vGPU的显卡可以分为三类:
第一类:传统的支持虚拟化的GPU卡
这类显卡不带显示输出,也不支持 SR-IOV,直接安装vGPU驱动即可支持。对这类显卡,我们准备了gpu01.sh、gpu02.sh、gpu03.sh 三个脚本。 gpu01.sh 替换源,并更新pve。 gpu02.sh 启用iommu。gpu03.sh 安装 NVIDIA vGPU的Host层的驱动。
由于NVIDIA GPU的驱动经常升级,gpu03.sh安装的是当前的比较合适的驱动。如果希望其他版本驱动,可以参考这个脚本,下载其他版本的驱动安装。
配置成功的标志是:使用 mdevctl types ,可以查询到GPU虚拟化后支持的vGPU类型
第二类:支持SR-IOV的数据中心的GPU卡
这类显卡,不带有显示输出功能,或者默认不启用显示输出。但是SR-IOV的功能缺省是不启用的。
这类显卡如果需要启用vGPU,需要执行 sriov-manager命令,启用SR-IOV功能。
在安装好Proxmox VE 主机的NVIDIA 驱动后,根据显卡的PCI地址,执行sriov-manage激活SR-IOV功能。
/usr/lib/nvidia/sriov-manage -e 0000:af:00.0
或者使用 ALL 参数,激活所有显卡的SR-IOV功能。
/usr/lib/nvidia/sriov-manage -e ALL
之后如果使用 mdevctl types 查询到vGPU类型,即配置成功了。
第三类:支持SR-IOV的工作站的GPU卡
这类显卡用于工作站,显卡默认处于显示输出模式。这类显卡用于vGPU就比较复杂。比如A5000、A6000下卡配置步骤如下:
1)确保用于虚拟化的显卡没有被用于本地的显示输出
比如工作站默认使用核显输出。 或者有一个亮机卡,用于默认输出。用于虚拟化的显卡不能用于显示输出。记得修改BIOS,设置默认输出的显卡。也可以拆开机器,把用于虚拟化的显卡先拔出来。确保系统可以开机并正常显示。然后再关机,插入需要虚拟的显卡。
2)使用NVIDIA的displaymodeselector,设置工作模式为physical_display_disabled模式。
通过 ./displaymodeselector –gpumode 设置显卡模式为physical_display_disabled
如果GPU被用于当前显示,该命令可能导致主机黑屏,无法显示。
通过 ./displaymodeselector –listgpumodes 确认GPU的模式为 如下状态
root@test:~# ./displaymodeselector --listgpumodes
NVIDIA Display Mode Selector Utility (Version 1.48.0)
Copyright (C) 2015-2020, NVIDIA Corporation. All Rights Reserved.
Adapter: Graphics Device (10DE,2230,1028,1459) S:00,B:AF,D:00,F:00
EEPROM ID (EF,6015) : WBond W25Q16FW/JW 1.65-1.95V 16384Kx1S, page
GPU Mode: Graphics mode with physical display disabled
copy
- 使用 sriov-manage 激活 SR-IOV 功能。
最后使用 mdevctl types 命令查询vGPU类型。如果查询到了,就配置成功了。
配置NVIDIA 的GPU后,如果可以查询 mdevctl types,即可被DoraCloud发现并使用。
如果是在 PVE8平台下,可以配置Resouce Mapping。DoraCloud可以通过ResouceMapping管理vGPU。
如果集群中某个型号的GPU只有一种分割方式,可以不用定义ResouceMapping。如果一种型号的GPU需要有多种分割方式,需要为每种分割方式定义个ResouceMapping,这样才能有效管理GPU。
2.2 GPU直通方案的配置
DoraCloud支持GPU直通需要搭配Proxmox VE 8.0。
配置过程如下:
1)执行 Proxmox VE 的更新和升级
如下命令升级到 Proxmox VE 8.x 的最新版本。
curl -o- http://vdi.doracloud.cn:9000/software/pveupdate.sh |bash
copy
然后 reboot 重启。
2)在Proxmox VE 的Cluster中增加 Resource Mapping。
假设主机上有1个A4000,可以创建一个 Resource Mapping,内容如下
TBD ,RM 截图。
2.3 Intel SR-IOV GPU的的配置
针对Intel的核显vGPU,DoraCloud提供了 sriov01.sh,sriov2.sh
12代CPU i5-12400d的主机,安装Proxmox 7/8后,执行如下命令,等待重启。
curl -o- http://vdi.doracloud.cn:9000/software/sriov01.sh |bash 然后执行如下命令,等待自动重启。
curl -o- http://vdi.doracloud.cn:9000/software/sriov02.sh |bash 最后使用 lspci |grep VGA 验证 vGPU已经启用。
浙公网安备 33010602011771号