2025 年 2月 11 日随笔档案 - ExplorerMan

RAG 引擎 RAGFlow

摘要： RAGFlow开源了一个RAG框架！RAGFlow ：一款基于深度文档理解构建的开源 RAG（Retrieval-Augmented Generation）引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程，结合大语言模型（LLM）针对用户各类不同的复杂格式数据提供可靠阅读全文

posted @ 2025-02-11 20:49 ExplorerMan 阅读(269) 评论(0) 推荐(0)

vLLM

摘要： ‌vLLM（Virtual Large Language Model）‌是一个用于优化大型语言模型（LLM）推理的高效系统。它的主要设计目标是通过减少计算开销和提高吞吐量，来加速LLM在推理阶段的性能‌1。技术特点和应用场景 vLLM具有以下核心特性： ‌高效内存管理‌：vLLM采用PagedAt 阅读全文

posted @ 2025-02-11 20:15 ExplorerMan 阅读(618) 评论(0) 推荐(0)

大模型在陌陌的推理与应用

摘要：导读本文将分享陌陌如何利用大模型技术革新其业务与研发流程。主要内容包括以下几个部分： 1. AI 应用范式更新 2. 大模型高效推理 3. 大模型应用平台 4. 未来展望 5. 总结 6. Q&A 分享嘉宾｜陈玉祥挚文集团算法工程专家编辑整理｜王文海内容校对｜李瑶出品社区｜DataFu 阅读全文

posted @ 2025-02-11 20:09 ExplorerMan 阅读(93) 评论(0) 推荐(0)

DeepSeek-V3 详解：深入探究下一代 AI 模型

摘要：如何使用 DeepSeek-V3：代码示例为了帮助您开始使用 DeepSeek-V3，这里有一些使用 Python 和Hugging Face Transformers 库的实际示例。安装所需的库首先，安装必要的库： pip install transformers torch 示例 1：使用阅读全文

posted @ 2025-02-11 16:20 ExplorerMan 阅读(839) 评论(0) 推荐(0)

关于 MoE 大模型负载均衡策略演进的回顾：坑点与经验教训

摘要：故事要从 GShard 说起——当时，人们意识到拥有数十亿甚至数万亿参数的模型可以通过某种形式的“稀疏化（sparsified）”来在保持高精度的同时加速训练。自那以后，我们见证了各种让人眼花缭乱的创新。本文将尝试把从 GShard 到 DeepSeek-V3 这一系列关键方案串联起来，看看每一次迭阅读全文

posted @ 2025-02-11 16:02 ExplorerMan 阅读(996) 评论(0) 推荐(0)

一文彻底整明白，基于Ollama工具的LLM大语言模型Web可视化对话机器人部署指南

摘要：为了方便把我们的大模型对话机器人分享出去，聊天机器人最后是基于Web网站，可通过浏览器访问，本文正是通过Ollama和WebUI在本地部署Llama 3Web 版聊天机器人，本文包括如下部分：什么是Ollama，它与Llama是什么关系？安装Ollama大语言模型工具安装Node.js编程语言阅读全文

posted @ 2025-02-11 11:27 ExplorerMan 阅读(395) 评论(0) 推荐(0)

LlaMA模型架构，什么是LlaMA？

摘要： 1）什么是LlaMA？LLaMA的全称是Large Language Model Meta AI，直译为“大语言模型元AI”。由于“Llama”在西班牙语中意为“羊驼”，因此社区也将其昵称为羊驼系模型。 LLaMA于2023年2月由Meta AI发布，是该系列的初代模型。随后，Meta AI又相继推阅读全文

posted @ 2025-02-11 11:25 ExplorerMan 阅读(565) 评论(0) 推荐(0)

ExplorerMan