sglang
python -m sglang.launch_server \ --model-path Qwen/Qwen2.5-0.5B \ --disable-cuda-graph \ --port 30000
博客园 © 2004-2025 浙公网安备 33010602011771号 浙ICP备2021040463号-3