大模型 - 随笔分类(第2页) - ExplorerMan

这篇文章终于讲清楚了MCP与Function Calling的关系！

摘要：这篇文章终于讲清楚了MCP与Function Calling的关系！-CSDN博客前言自从大语言模型（LLM）横空出世以来，如何将 LLM 与现有商业系统有效结合、让其真正赋能各类业务，已成为当前最热门的研究方向之一。 Function Calling[1] 和 Model Context Pro 阅读全文

posted @ 2025-04-22 11:09 ExplorerMan 阅读(544) 评论(0) 推荐(0)

一个多模态多智能体文档理解框架：MDocAgent

摘要：这个论文怎么复现或者工程落地 def mdoc_agent(question, document): # 预处理文档 text_segments, image_pages = preprocess_document(document) # 检索相关上下文 top_k_text, top_k_im 阅读全文

posted @ 2025-04-21 21:55 ExplorerMan 阅读(325) 评论(0) 推荐(0)

Cursor高效开发必备的MCP资源合集

摘要：一行代码快速体验MCP 访问下面这个网站： https://smithery.ai/ 随便选一个cursor，在安装这里找到cursor配置，然后复制到cursor中 📂 浏览器自动化 Web 内容访问和自动化功能。支持以 AI 友好格式搜索、抓取和处理 Web 内容。 @blackwhite0 阅读全文

posted @ 2025-04-21 16:45 ExplorerMan 阅读(441) 评论(0) 推荐(0)

cursor 使用指南

摘要：一基础配置 1.1 汉化输入Chinese，选择简体中文Install. 1.2 Vscode迁移Cursor 手动导入 settings.json 和代码片段方案一：直接复制文件目录说明 Mac VSCode 目录 /Users/电脑用户名/Library/Application Supp 阅读全文

posted @ 2025-04-21 16:40 ExplorerMan 阅读(4220) 评论(0) 推荐(0)

Cursor vs VSCode：主要区别与优势分析

摘要：Cursor - The AI Code Editor 概述从年中cursor开源以来，逐渐火遍全网，成为编程的又一更强力助手。 Cursor 是由 Anysphere 这个实验室打造的代码编辑器，它基于 VSCode 修改派生，因此所有你在 VSCode 上的配置都能够导入到 Cursor 里使用阅读全文

posted @ 2025-04-21 16:08 ExplorerMan 阅读(1835) 评论(0) 推荐(0)

Python 办公自动化之 PDF 的详细操作（全）

摘要：大家伙，我是小一办公自动化应该算是打工人上班摸鱼的极致追求了，况且对于 Python 爱好者来说，办公自动化简直是太简单了比如，今天的办公自动化主题：Python 操作 PDF 关于 Python 与 PDF 的操作，前面也有提到几篇，文末也会列出相关几篇文章，感兴趣的可以都学习一下今天的具阅读全文

posted @ 2025-04-17 17:07 ExplorerMan 阅读(169) 评论(0) 推荐(0)

一文读懂多模态大模型：强化学习技术全面解读 SFT、RLHF、RLAIF、DPO

摘要：〔更多精彩AI内容，尽在「魔方AI空间」，引领AIGC科技时代〕本文作者：猫先生知识库：https://aigcmagic.feishu.cn 本文从强化学习如何增强大语言模型（LLMs）的视角，进行系统性全面解读，涵盖强化学习的基础知识、流行的RL增强LLMs、基于奖励模型的RL技术（RLHF和阅读全文

posted @ 2025-04-15 18:03 ExplorerMan 阅读(1755) 评论(0) 推荐(0)

使用文心大模型Function Call

摘要：需求背景设想一个使用手机语音点外卖的场景，我们需要开发一个APP，这个APP可以与用户进行语音对话，能够理解用户的意图，为用户推荐外卖商品，当用户对某款商品满意时，为用户自动下单。语音转文字（ASR）有成熟方案，不是本文关注的目标，这里不再赘述，如果对这个技术感兴趣，在百度智能云官网上能找到对应阅读全文

posted @ 2025-04-09 20:24 ExplorerMan 阅读(108) 评论(0) 推荐(0)

MCP开发实战-如何使用MCP真正加速UE项目开发

摘要：用说人话的方式讲解MCP 转：https://mp.weixin.qq.com/s/0o3rb1fl2XXBIDZHAbiRoA 目前各种MCP的文章和实际例子以及开源工具层出不穷，本文试图用最简单的方式解释下MCP解决什么问题和MCP怎么写的问题。为啥要用MCP MCP是一项专为LLM工具化操作阅读全文

posted @ 2025-04-01 17:41 ExplorerMan 阅读(280) 评论(0) 推荐(0)

LangGraph、LangChain、LangFlow、LangSmith：使用哪一个以及为什么？

摘要：探索 LangGraph、LangChain、LangFlow 和 LangSmith 之间的关键区别，了解哪种框架最适合您的语言模型应用——从工作流构建到性能监控。近年来，自然语言处理（NLP）领域见证了可用于构建基于语言模型的应用程序的框架、库和工具数量的激增。在这些工具中，LangGraph 阅读全文

posted @ 2025-03-31 20:59 ExplorerMan 阅读(1176) 评论(0) 推荐(0)

LLM应用落地实施手册

摘要：转：https://www.cnblogs.com/boydfd/p/18791215 背景自ChatGPT诞生以来，各个企业都开始尝试引入LLM落地实施“智能”应用，而目前并没有太多文章系统地介绍应该怎么落地实施一个基于LLM的应用，到底应该做哪些步骤。本人从2023年12月份开始，陆陆续续开发阅读全文

posted @ 2025-03-25 15:08 ExplorerMan 阅读(99) 评论(0) 推荐(0)

Pre-training、Post-training、Continue training的区别

摘要：在训练大语言模型时，大家可能会搞混以下几个概念，下面做一个详细的对比区分：概念 Pre-training（预训练） Post-training（后训练） Continue Training（持续训练）定义预训练是指在模型的初始阶段，使用大量数据对模型进行训练，以便让模型学习到通用的特征和知识。这阅读全文

posted @ 2025-03-21 15:56 ExplorerMan 阅读(955) 评论(0) 推荐(0)

CRAG 纠错检索增强方法详解

摘要：CRAG（Corrective Retrieval Augmented Generation）是一种纠错检索增强生成方法，其主要步骤如下： 1. 检索阶段用户输入查询：用户向系统输入一个查询请求，例如“艾萨克·牛顿是如何发现万有引力的？”。检索器检索文档：系统中的检索器根据用户查询从预设的知阅读全文

posted @ 2025-03-20 16:23 ExplorerMan 阅读(139) 评论(0) 推荐(0)

INP 洞见，AI 时代 Data Infra 的必争之地——湖仓架构

摘要：湖仓架构与概念在北美大火，多家科技巨头纷纷跟进 01 今年众多的 AI 交易中，有如下两笔交易： 6月4日，Databricks 宣布收购最火的数据湖表格式 Apache Iceberg 背后的商业机构 Tabular，Databricks 表示最终的交易价格将在 10 亿美元以上。 6月21日，O 阅读全文

posted @ 2025-03-19 19:57 ExplorerMan 阅读(242) 评论(0) 推荐(0)

反幻觉（Anti-Hallucination）

摘要：反幻觉（Anti-Hallucination）的核心目标问题本质：生成模型（如大语言模型）可能虚构信息（幻觉），需通过技术手段约束其输出，使其更忠实于事实或输入数据。常见方法：知识增强：引入外部知识库（如检索数据库、向量数据库）辅助生成。事实检查模块：通过后处理验证输出准确性。 Prompt 阅读全文

posted @ 2025-03-19 17:26 ExplorerMan 阅读(57) 评论(0) 推荐(0)

减少 LLM 幻觉方法--CoVe

摘要：https://zhuanlan.zhihu.com/p/678902427 来自于 Meta AI，原文链接如下：原文链接arxiv.org/abs/2309.11495 LLM 经常遇到的主要问题就是幻觉，减少幻觉的方法大致可分为三类：训练时校正、生成时校正和通过增强（使用工具）进行校正。阅读全文

posted @ 2025-03-19 17:25 ExplorerMan 阅读(205) 评论(0) 推荐(0)

蚂蚁集团在大模型推荐上的算法和应用

摘要：导读本文将分享大模型在蚂蚁集团推荐场景中的应用（以下全部为蚂蚁集团的研究工作及落地）。主要内容包括以下几大部分： 1. 背景介绍 2. 利用大模型进行知识提取 3. 大模型作为教师模型 4. Q&A 分享嘉宾｜胡斌斌蚂蚁集团AI创新研发部门NextEvo 算法专家编辑整理｜王甲君内容校对｜阅读全文

posted @ 2025-03-19 16:52 ExplorerMan 阅读(457) 评论(0) 推荐(0)

EmoLLM-心理健康大模型

摘要：EmoLLM 是一系列能够支持理解用户-支持用户-帮助用户心理健康辅导链路的心理健康大模型，由 LLM指令微调而来，欢迎大家star~⭐⭐。目前已经开源的 LLM 微调配置如下：心理健康大模型（Mental Health Grand Model）是一个综合性的概念，它旨在全面理解和促进个体、群阅读全文

posted @ 2025-03-19 16:30 ExplorerMan 阅读(145) 评论(0) 推荐(0)

PingCAP 王琦智：下一代 RAG，tidb.ai 使用知识图谱增强 RAG 能力

摘要：导读随着 ChatGPT 的流行，LLMs（大语言模型）再次进入人们的视野。然而，在处理特定领域查询时，大模型生成的内容往往存在信息滞后和准确性不足的问题。如何让 RAG 和向量搜索技术在实际应用中更好地满足企业需求？如何在向量之上构建全链路 RAG 服务，提升开发者效率，降低成本？本文整理自 T 阅读全文

posted @ 2025-03-18 23:28 ExplorerMan 阅读(118) 评论(0) 推荐(0)

万字长文分享快手 Kolors 可图大模型应用实践

摘要：在企业提效方面，多模态能力同样具有重要意义。在 AICon 北京站活动中，我们邀请了快手「可图」大模型负责人李岩，他分享了主题为《快手「可图」文生图大模型应用实践》的演讲内容，以下为李岩演讲内容～期待对你有所启发！另外，在 8 月 18-19 日即将举办的 AICon 全球人工智能开发与应用大会上阅读全文

posted @ 2025-03-18 23:20 ExplorerMan 阅读(101) 评论(0) 推荐(0)

ExplorerMan

随笔分类 - 大模型