2025年11月18日
摘要: 指定使用第0块显卡启动qianwen3-8b模型,运行如下命令: CUDA_VISIBLE_DEVICES=1 /usr/local/python310/bin/python3 /usr/local/python310/bin/vllm serve /data/llm/qianwen3/8b --m 阅读全文
posted @ 2025-11-18 09:34 momingliu11 阅读(14) 评论(0) 推荐(0)