02 2025 档案
摘要:Ollama vs vLLM:并发性能深度评测 目录Ollama vs vLLM:并发性能深度评测引言一、背景介绍二、前期准备测试环境准备Locust 压测工具编写压测脚本三、性能测试vLLM单线程测试5个线程测试10个线程测试20个线程测试Ollama单线程测试5个线程测试10个线程测试20个线程
阅读全文
摘要:目录前言大型语言模型(LLM)部署工具对比Ollama和vLLM的一些选型建议vLLM 简介vLLM 安装部署使用 pip 安装遇到的问题解决HuggingFace 获取模型huggingface-cli 下载模型安装依赖下载模型hf_transfer 加速设置镜像站方式一方式二下载使用示例vLLM
阅读全文

浙公网安备 33010602011771号