昇腾910b服务器初始化
1、固件及驱动更新
下载地址:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=32&cann=8.3.RC1.alpha002&driver=Ascend+HDK+25.2.0
执行:
- sh Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run --run --quiet
- sh Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run --run --quiet
2、npu检查
参考链接:https://modelers.cn/models/MindIE/DeepSeek-R1 见“推理前准备”小节
命令:
# 1.检查物理链接 for i in {0..7}; do hccn_tool -i $i -lldp -g | grep Ifname; done # 2.检查链接情况 for i in {0..7}; do hccn_tool -i $i -link -g ; done # 3.检查网络健康情况 for i in {0..7}; do hccn_tool -i $i -net_health -g ; done # 4.查看侦测ip的配置是否正确 for i in {0..7}; do hccn_tool -i $i -netdetect -g ; done # 5.查看网关是否配置正确 for i in {0..7}; do hccn_tool -i $i -gateway -g ; done # 6.检查NPU底层tls校验行为一致性,建议统一全部设置为0,避免hccl报错 for i in {0..7}; do hccn_tool -i $i -tls -g ; done | grep switch # 7.NPU底层tls校验行为置0操作,建议统一全部设置为0,避免hccl报错 for i in {0..7};do hccn_tool -i $i -tls -s enable 0;done # 8.获取每张卡地址 for i in {0..7};do hccn_tool -i $i -ip -g; done
3、mindie镜像
下载地址:https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f
4、大模型推理服务