昇腾910b服务器初始化

1、固件及驱动更新

  下载地址:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=32&cann=8.3.RC1.alpha002&driver=Ascend+HDK+25.2.0

  执行:

  • sh Ascend-hdk-910b-npu-firmware_7.7.0.6.236.run --run --quiet
  • sh Ascend-hdk-910b-npu-driver_25.2.0_linux-aarch64.run --run --quiet

2、npu检查

  参考链接:https://modelers.cn/models/MindIE/DeepSeek-R1 见“推理前准备”小节

  命令:

# 1.检查物理链接
for i in {0..7}; do hccn_tool -i $i -lldp -g | grep Ifname; done
# 2.检查链接情况
for i in {0..7}; do hccn_tool -i $i -link -g ; done
# 3.检查网络健康情况
for i in {0..7}; do hccn_tool -i $i -net_health -g ; done
# 4.查看侦测ip的配置是否正确
for i in {0..7}; do hccn_tool -i $i -netdetect -g ; done
# 5.查看网关是否配置正确
for i in {0..7}; do hccn_tool -i $i -gateway -g ; done
# 6.检查NPU底层tls校验行为一致性,建议统一全部设置为0,避免hccl报错
for i in {0..7}; do hccn_tool -i $i -tls -g ; done | grep switch
# 7.NPU底层tls校验行为置0操作,建议统一全部设置为0,避免hccl报错
for i in {0..7};do hccn_tool -i $i -tls -s enable 0;done
# 8.获取每张卡地址
for i in {0..7};do hccn_tool -i $i -ip -g; done

 

3、mindie镜像

  下载地址:https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f

4、大模型推理服务

posted @ 2025-09-12 23:13  badwood  阅读(36)  评论(0)    收藏  举报
Badwood's Blog