摘要:
指定使用第0块显卡启动qianwen3-8b模型,运行如下命令: CUDA_VISIBLE_DEVICES=1 /usr/local/python310/bin/python3 /usr/local/python310/bin/vllm serve /data/llm/qianwen3/8b --m 阅读全文
posted @ 2025-11-18 09:34
momingliu11
阅读(14)
评论(0)
推荐(0)
浙公网安备 33010602011771号