摘要: vLLM vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架,提供易用、快速、便宜的LLM服务,支持绝大多数LLM模型的推理加速,类似Ollama/llama.cpp等大模型框架一样,主要用于模型推理,微调以及部署。 vLLM 是一个Python库,同时也包含预编译的C++和CUDA(1 阅读全文
posted @ 2025-04-16 15:20 凫弥 阅读(816) 评论(0) 推荐(0)
摘要: Tavily 官网:https://tavily.com/ 介绍 Tavily是一个为大型语言模型(LLMs)和检索增强生成(RAG)优化的搜索引擎,旨在提供高效、快速且持久的搜索结果。该产品由Tavily团队开发,目标用户是AI开发者、研究人员以及需要实时、准确、有根据的信息的企业。Tavily 阅读全文
posted @ 2025-04-16 14:01 凫弥 阅读(3177) 评论(0) 推荐(0)