2025年2月12日

大模型推理框架

摘要: 以下是目前比较流行的大模型推理框架: 1. vLLM 特点:专注于高性能推理和服务的开源框架。核心创新在于PagedAttention技术,优化了注意力机制的内存使用效率,并通过连续批处理技术提升GPU利用率。 优势:支持多种量化方法,与OpenAI API兼容,与Hugging Face生态系统深 阅读全文

posted @ 2025-02-12 14:47 ExplorerMan 阅读(351) 评论(0) 推荐(0)

GraphRAG

摘要: 微软年中开源 GraphRAG 是一个现象级事件,作为一个库而非端到端产品,能在短时间内获得大量关注,说明它确实解决了 RAG 的一些核心问题——这就是语义鸿沟。做搜索系统的人很早就在面临这样的麻烦,因为查询和答案之间并不总能保证可以匹配。当搜索系统升级到 RAG 之后,这样的问题被放大:搜索系统的 阅读全文

posted @ 2025-02-12 11:48 ExplorerMan 阅读(34) 评论(0) 推荐(0)

导航