华为2288H V3 安装英伟达Tesla V100 SXM2显卡

  1. 硬件安装

    华为RH2288H V3服务器是比较老的一款服务器了,利旧原则,公司安排,看看是否能安装Tesla V100 SXM2显卡(1k出头价格),部署测试OCR识别大模型。
    显卡Tesla V100 SXM2属于数据中心专用卡,接口特殊,现在某宝、某鱼都有改装的成涡扇散热器+PCIE接口,这样尺寸和接口就能在普通电脑和服务器上安装。功耗300W,双8Pin接口,增加扇热器和转接板后的尺寸(26.510.54cm),正好是标准的双槽的大小,功耗应该是大于2个PCIE接口的,理论上上线应该是150W,不知道服务器的接口是否有特殊供电设计,可以提供更好的功率(资料暂时未查到)。
    这个服务器属于超聚变分家之前的产品,安装之前咨询一下,通过售后途径问了一圈,官方公众号建议打400,400建议找公众号。x86的老款,加上年数久了,x86业务也变更了,估计不好找到维护人员了。2288H V5是支持V100、A100等显卡。官方的文档提示支持:K20c、K10、7120P、Tesla P4、M60等型号的GPU显卡,所以打算试试看。

    采用Riser卡型号为:C11PERH,双槽的这种,可以提供双8Pin的供电接口。
    image
    图片里第二个PCIE 插槽,是pcie 3.0 x16的,上面的是x8的,尺寸、接口正好一个Riser卡安装一个显卡。
    显卡安装到Riser卡上示意图,此处注意,Riaser卡8Pin到显卡接口,线材最少要20cm,太短够不到,推荐25cm。
    image
    通过卡扣免螺丝扣上,显卡安装到Riser卡侧面图
    image
    裸Riser卡安装后的效果如图:
    image
    小众产品,某宝可以找找有价格两位数的一家,极具性价比。
    显卡安装到服务器上的效果图
    image

  2. 驱动安装及压测

安装后在ubuntu 22.04系统里执行
lspci |grep -i nvidia发现设备信息如下:
NVIDIA Corporation GV100GL [Tesla V100 SXM2 16GB]
表示识别成功,安装驱动后(细节略过,参考其他文章安装含CUDA Toolkit版本驱动)
压测GPU,是否能正常使用,服务器电源为700W,双路E5
压测软件为gpu-burn, https://github.com/wilicc/gpu-burn
操作方法
git clone https://github.com/wilicc/gpu-burn
cd gpu-burn
make
缺东西,自行apt安装
压测时,通过 nvidia-smi dmon持续观察功率、负载,可以跑满接近300W,温度控制也可以,在日常低负载的测试情况下,可以满足。

posted @ 2025-12-13 10:56  阿腾哥哥  阅读(71)  评论(0)    收藏  举报