随笔分类 -  大模型

大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用
摘要:大模型基础应用框架(ReACT\SFT\RAG)技术创新及零售业务落地应用 一、前言 2023年,大语言模型以前所未有的速度和能力改变我们对智能系统的认知,成为技术圈最被热议的话题。但“百模大战”终将走向“落地为王”,如何将大语言模型的强大能力融入实际业务、产生业务价值成为致胜关键。 在零售场,大模 阅读全文

posted @ 2025-07-02 17:10 ExplorerMan 阅读(53) 评论(0) 推荐(0)

多模态Embedding模型:从文本到多模态的全面选型指南!
摘要:通过将原始输入转化为固定维度的高维向量以捕捉语义信息,Embedding(嵌入)模型在构建 RAG、推荐系统,甚至自动驾驶模型训练中都发挥着极为关键的作用。近年来,OpenAI、Meta、Google、阿里、腾讯等科技巨头纷纷加大对 Embedding 模型研发的投入。以 OpenA I为例,其最新 阅读全文

posted @ 2025-07-01 22:50 ExplorerMan 阅读(495) 评论(0) 推荐(0)

rag 查询检索轮换
摘要:“RAG查询轮换”通常指在检索增强生成(Retrieval-Augmented Generation, RAG)系统中,通过动态调整检索和生成阶段的策略或数据源,以优化查询结果质量、多样性或效率的技术。以下是具体解释: 1. RAG的基本原理 RAG结合了信息检索(Retrieval)和文本生成(G 阅读全文

posted @ 2025-07-01 22:01 ExplorerMan 阅读(15) 评论(0) 推荐(0)

多模型专家组合(COE)的关键实现方法,deepseek也在用
摘要:1.概述 在当前的人工智能发展中,单一模型的表现往往难以满足复杂任务的需求。为应对这些挑战,多模型协作的方法应运而生,“专家组合”(Mixture of Experts)便是其中一种有效的模型协作方法。专家组合不仅能提升模型的准确性,还能通过合理分工提升效率,提供跨领域的综合解决方案。本文将从多个角 阅读全文

posted @ 2025-05-14 20:55 ExplorerMan 阅读(58) 评论(0) 推荐(0)

超越传统标注方法:doccano平台提供智能化数据标注解决方案
摘要:目录前言一、doccano的介绍、安装1-1、doccano的介绍1-2、doccano的安装、初始化配置二、序列标注任务2-1、登录2-2、创建任务2-3、数据上传2-4、添加标签2-5、任务标注2-6、数据导出总结前言Doccano是一种用于文本标注的开源工具,旨在简化和加速标注任务的进行。它提 阅读全文

posted @ 2025-04-27 17:23 ExplorerMan 阅读(287) 评论(0) 推荐(0)

mcp server Prompts client 具体怎么使用呢
摘要:在MCP(Model Context Protocol)架构中,Prompts(提示)是通过MCP Client与MCP Server交互来使用的。Prompts主要用于引导LLM(大型语言模型)生成特定类型的内容或回答。以下是具体使用Prompts的步骤和流程: 1. 配置MCP Client 安 阅读全文

posted @ 2025-04-24 18:10 ExplorerMan 阅读(1023) 评论(0) 推荐(0)

一文弄懂用Go实现MCP服务
摘要:最近这段时间,AI领域里有一个非常热门的概念——MCP(模型上下文协议)。Anthropic推出的这一开放标准旨在为大型语言模型和AI助手提供统一的接口,使其能够轻松操作外部工具并完成更复杂的任务。 本文将带你速览MCP的核心概念,并以Go语言为例,介绍如何开发MCP服务端和客户端。 为什么MCP如 阅读全文

posted @ 2025-04-22 16:41 ExplorerMan 阅读(309) 评论(0) 推荐(0)

如何用golang实现一个MCP Server
摘要:什么是MCP?MCP(Model Communication Protocol)是一种用于大语言模型(LLM)与外部工具进行交互的协议。它允许大语言模型在处理用户请求时,调用外部工具(如计算器、API、数据库等)来完成特定任务。通过 MCP,大语言模型可以扩展其功能,而无需自己实现所有逻辑。MCP 阅读全文

posted @ 2025-04-22 16:40 ExplorerMan 阅读(382) 评论(0) 推荐(0)

这篇文章终于讲清楚了MCP与Function Calling的关系!
摘要:这篇文章终于讲清楚了MCP与Function Calling的关系!-CSDN博客 前言自从大语言模型(LLM)横空出世以来,如何将 LLM 与现有商业系统有效结合、让其真正赋能各类业务,已成为当前最热门的研究方向之一。 Function Calling[1] 和 Model Context Pro 阅读全文

posted @ 2025-04-22 11:09 ExplorerMan 阅读(442) 评论(0) 推荐(0)

一个多模态多智能体文档理解框架:MDocAgent
摘要:这个论文 怎么复现 或者工程落地 def mdoc_agent(question, document): # 预处理文档 text_segments, image_pages = preprocess_document(document) # 检索相关上下文 top_k_text, top_k_im 阅读全文

posted @ 2025-04-21 21:55 ExplorerMan 阅读(231) 评论(0) 推荐(0)

Cursor高效开发必备的MCP资源合集
摘要:一行代码快速体验MCP 访问下面这个网站: https://smithery.ai/ 随便选一个cursor,在安装这里找到cursor配置, 然后复制到cursor中 📂 浏览器自动化 Web 内容访问和自动化功能。支持以 AI 友好格式搜索、抓取和处理 Web 内容。 @blackwhite0 阅读全文

posted @ 2025-04-21 16:45 ExplorerMan 阅读(356) 评论(0) 推荐(0)

cursor 使用指南
摘要:一 基础配置 1.1 汉化 输入Chinese,选择简体中文Install. 1.2 Vscode迁移Cursor 手动导入 settings.json 和代码片段 方案一:直接复制文件 目录说明 Mac VSCode 目录 /Users/电脑用户名/Library/Application Supp 阅读全文

posted @ 2025-04-21 16:40 ExplorerMan 阅读(2704) 评论(0) 推荐(0)

Cursor vs VSCode:主要区别与优势分析
摘要:Cursor - The AI Code Editor 概述从年中cursor开源以来,逐渐火遍全网,成为编程的又一更强力助手。 Cursor 是由 Anysphere 这个实验室打造的代码编辑器,它基于 VSCode 修改派生,因此所有你在 VSCode 上的配置都能够导入到 Cursor 里使用 阅读全文

posted @ 2025-04-21 16:08 ExplorerMan 阅读(1557) 评论(0) 推荐(0)

Python 办公自动化之 PDF 的详细操作(全)
摘要:大家伙,我是小一 办公自动化应该算是打工人上班摸鱼的极致追求了,况且对于 Python 爱好者来说,办公自动化简直是太简单了 比如,今天的办公自动化主题:Python 操作 PDF 关于 Python 与 PDF 的操作,前面也有提到几篇,文末也会 列出相关几篇文章,感兴趣的可以都学习一下 今天的具 阅读全文

posted @ 2025-04-17 17:07 ExplorerMan 阅读(98) 评论(0) 推荐(0)

一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO
摘要:〔更多精彩AI内容,尽在「魔方AI空间」,引领AIGC科技时代〕 本文作者:猫先生知识库:https://aigcmagic.feishu.cn 本文从强化学习如何增强大语言模型(LLMs)的视角,进行系统性全面解读,涵盖强化学习的基础知识、流行的RL增强LLMs、基于奖励模型的RL技术(RLHF和 阅读全文

posted @ 2025-04-15 18:03 ExplorerMan 阅读(946) 评论(0) 推荐(0)

使用文心大模型Function Call
摘要:需求背景 设想一个使用手机语音点外卖的场景,我们需要开发一个APP,这个APP可以与用户进行语音对话,能够理解用户的意图,为用户推荐外卖商品,当用户对某款商品满意时,为用户自动下单。 语音转文字(ASR)有成熟方案,不是本文关注的目标,这里不再赘述,如果对这个技术感兴趣,在百度智能云官网上能找到对应 阅读全文

posted @ 2025-04-09 20:24 ExplorerMan 阅读(71) 评论(0) 推荐(0)

MCP开发实战-如何使用MCP真正加速UE项目开发
摘要:用说人话的方式讲解MCP 转:https://mp.weixin.qq.com/s/0o3rb1fl2XXBIDZHAbiRoA 目前各种MCP的文章和实际例子以及开源工具层出不穷,本文试图用最简单的方式解释下MCP解决什么问题和MCP怎么写的问题。 为啥要用MCP MCP是一项专为LLM工具化操作 阅读全文

posted @ 2025-04-01 17:41 ExplorerMan 阅读(239) 评论(0) 推荐(0)

LangGraph、LangChain、LangFlow、LangSmith:使用哪一个以及为什么?
摘要:探索 LangGraph、LangChain、LangFlow 和 LangSmith 之间的关键区别,了解哪种框架最适合您的语言模型应用——从工作流构建到性能监控。 近年来,自然语言处理(NLP)领域见证了可用于构建基于语言模型的应用程序的框架、库和工具数量的激增。在这些工具中,LangGraph 阅读全文

posted @ 2025-03-31 20:59 ExplorerMan 阅读(910) 评论(0) 推荐(0)

LLM应用落地实施手册
摘要:转:https://www.cnblogs.com/boydfd/p/18791215 背景 自ChatGPT诞生以来,各个企业都开始尝试引入LLM落地实施“智能”应用,而目前并没有太多文章系统地介绍应该怎么落地实施一个基于LLM的应用,到底应该做哪些步骤。本人从2023年12月份开始,陆陆续续开发 阅读全文

posted @ 2025-03-25 15:08 ExplorerMan 阅读(80) 评论(0) 推荐(0)

Pre-training、Post-training、Continue training的区别
摘要:在训练大语言模型时,大家可能会搞混以下几个概念,下面做一个详细的对比区分: 概念 Pre-training(预训练) Post-training(后训练) Continue Training(持续训练)定义 预训练是指在模型的初始阶段,使用大量数据对模型进行训练,以便让模型学习到通用的特征和知识。这 阅读全文

posted @ 2025-03-21 15:56 ExplorerMan 阅读(644) 评论(0) 推荐(0)

导航