随笔分类 -  大模型

这篇文章终于讲清楚了MCP与Function Calling的关系!
摘要:这篇文章终于讲清楚了MCP与Function Calling的关系!-CSDN博客 前言自从大语言模型(LLM)横空出世以来,如何将 LLM 与现有商业系统有效结合、让其真正赋能各类业务,已成为当前最热门的研究方向之一。 Function Calling[1] 和 Model Context Pro 阅读全文

posted @ 2025-04-22 11:09 ExplorerMan 阅读(544) 评论(0) 推荐(0)

一个多模态多智能体文档理解框架:MDocAgent
摘要:这个论文 怎么复现 或者工程落地 def mdoc_agent(question, document): # 预处理文档 text_segments, image_pages = preprocess_document(document) # 检索相关上下文 top_k_text, top_k_im 阅读全文

posted @ 2025-04-21 21:55 ExplorerMan 阅读(325) 评论(0) 推荐(0)

Cursor高效开发必备的MCP资源合集
摘要:一行代码快速体验MCP 访问下面这个网站: https://smithery.ai/ 随便选一个cursor,在安装这里找到cursor配置, 然后复制到cursor中 📂 浏览器自动化 Web 内容访问和自动化功能。支持以 AI 友好格式搜索、抓取和处理 Web 内容。 @blackwhite0 阅读全文

posted @ 2025-04-21 16:45 ExplorerMan 阅读(441) 评论(0) 推荐(0)

cursor 使用指南
摘要:一 基础配置 1.1 汉化 输入Chinese,选择简体中文Install. 1.2 Vscode迁移Cursor 手动导入 settings.json 和代码片段 方案一:直接复制文件 目录说明 Mac VSCode 目录 /Users/电脑用户名/Library/Application Supp 阅读全文

posted @ 2025-04-21 16:40 ExplorerMan 阅读(4220) 评论(0) 推荐(0)

Cursor vs VSCode:主要区别与优势分析
摘要:Cursor - The AI Code Editor 概述从年中cursor开源以来,逐渐火遍全网,成为编程的又一更强力助手。 Cursor 是由 Anysphere 这个实验室打造的代码编辑器,它基于 VSCode 修改派生,因此所有你在 VSCode 上的配置都能够导入到 Cursor 里使用 阅读全文

posted @ 2025-04-21 16:08 ExplorerMan 阅读(1835) 评论(0) 推荐(0)

Python 办公自动化之 PDF 的详细操作(全)
摘要:大家伙,我是小一 办公自动化应该算是打工人上班摸鱼的极致追求了,况且对于 Python 爱好者来说,办公自动化简直是太简单了 比如,今天的办公自动化主题:Python 操作 PDF 关于 Python 与 PDF 的操作,前面也有提到几篇,文末也会 列出相关几篇文章,感兴趣的可以都学习一下 今天的具 阅读全文

posted @ 2025-04-17 17:07 ExplorerMan 阅读(169) 评论(0) 推荐(0)

一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO
摘要:〔更多精彩AI内容,尽在「魔方AI空间」,引领AIGC科技时代〕 本文作者:猫先生知识库:https://aigcmagic.feishu.cn 本文从强化学习如何增强大语言模型(LLMs)的视角,进行系统性全面解读,涵盖强化学习的基础知识、流行的RL增强LLMs、基于奖励模型的RL技术(RLHF和 阅读全文

posted @ 2025-04-15 18:03 ExplorerMan 阅读(1755) 评论(0) 推荐(0)

使用文心大模型Function Call
摘要:需求背景 设想一个使用手机语音点外卖的场景,我们需要开发一个APP,这个APP可以与用户进行语音对话,能够理解用户的意图,为用户推荐外卖商品,当用户对某款商品满意时,为用户自动下单。 语音转文字(ASR)有成熟方案,不是本文关注的目标,这里不再赘述,如果对这个技术感兴趣,在百度智能云官网上能找到对应 阅读全文

posted @ 2025-04-09 20:24 ExplorerMan 阅读(108) 评论(0) 推荐(0)

MCP开发实战-如何使用MCP真正加速UE项目开发
摘要:用说人话的方式讲解MCP 转:https://mp.weixin.qq.com/s/0o3rb1fl2XXBIDZHAbiRoA 目前各种MCP的文章和实际例子以及开源工具层出不穷,本文试图用最简单的方式解释下MCP解决什么问题和MCP怎么写的问题。 为啥要用MCP MCP是一项专为LLM工具化操作 阅读全文

posted @ 2025-04-01 17:41 ExplorerMan 阅读(280) 评论(0) 推荐(0)

LangGraph、LangChain、LangFlow、LangSmith:使用哪一个以及为什么?
摘要:探索 LangGraph、LangChain、LangFlow 和 LangSmith 之间的关键区别,了解哪种框架最适合您的语言模型应用——从工作流构建到性能监控。 近年来,自然语言处理(NLP)领域见证了可用于构建基于语言模型的应用程序的框架、库和工具数量的激增。在这些工具中,LangGraph 阅读全文

posted @ 2025-03-31 20:59 ExplorerMan 阅读(1176) 评论(0) 推荐(0)

LLM应用落地实施手册
摘要:转:https://www.cnblogs.com/boydfd/p/18791215 背景 自ChatGPT诞生以来,各个企业都开始尝试引入LLM落地实施“智能”应用,而目前并没有太多文章系统地介绍应该怎么落地实施一个基于LLM的应用,到底应该做哪些步骤。本人从2023年12月份开始,陆陆续续开发 阅读全文

posted @ 2025-03-25 15:08 ExplorerMan 阅读(99) 评论(0) 推荐(0)

Pre-training、Post-training、Continue training的区别
摘要:在训练大语言模型时,大家可能会搞混以下几个概念,下面做一个详细的对比区分: 概念 Pre-training(预训练) Post-training(后训练) Continue Training(持续训练)定义 预训练是指在模型的初始阶段,使用大量数据对模型进行训练,以便让模型学习到通用的特征和知识。这 阅读全文

posted @ 2025-03-21 15:56 ExplorerMan 阅读(955) 评论(0) 推荐(0)

CRAG 纠错检索增强方法详解
摘要:CRAG(Corrective Retrieval Augmented Generation)是一种纠错检索增强生成方法,其主要步骤如下: 1. 检索阶段 用户输入查询 :用户向系统输入一个查询请求,例如“艾萨克·牛顿是如何发现万有引力的?”。 检索器检索文档 :系统中的检索器根据用户查询从预设的知 阅读全文

posted @ 2025-03-20 16:23 ExplorerMan 阅读(139) 评论(0) 推荐(0)

INP 洞见,AI 时代 Data Infra 的必争之地——湖仓架构
摘要:湖仓架构与概念在北美大火,多家科技巨头纷纷跟进 01 今年众多的 AI 交易中,有如下两笔交易: 6月4日,Databricks 宣布收购最火的数据湖表格式 Apache Iceberg 背后的商业机构 Tabular,Databricks 表示最终的交易价格将在 10 亿美元以上。 6月21日,O 阅读全文

posted @ 2025-03-19 19:57 ExplorerMan 阅读(242) 评论(0) 推荐(0)

反幻觉(Anti-Hallucination)
摘要:反幻觉(Anti-Hallucination)的核心目标 问题本质:生成模型(如大语言模型)可能虚构信息(幻觉),需通过技术手段约束其输出,使其更忠实于事实或输入数据。 常见方法: 知识增强:引入外部知识库(如检索数据库、向量数据库)辅助生成。 事实检查模块:通过后处理验证输出准确性。 Prompt 阅读全文

posted @ 2025-03-19 17:26 ExplorerMan 阅读(57) 评论(0) 推荐(0)

减少 LLM 幻觉方法--CoVe
摘要:https://zhuanlan.zhihu.com/p/678902427 来自于 Meta AI,原文链接如下: 原文链接​arxiv.org/abs/2309.11495 LLM 经常遇到的主要问题就是幻觉,减少幻觉的方法大致可分为三类:训练时校正、生成时校正和通过增强(使用工具)进行校正。 阅读全文

posted @ 2025-03-19 17:25 ExplorerMan 阅读(205) 评论(0) 推荐(0)

蚂蚁集团在大模型推荐上的算法和应用
摘要:导读 本文将分享大模型在蚂蚁集团推荐场景中的应用(以下全部为蚂蚁集团的研究工作及落地)。 主要内容包括以下几大部分: 1. 背景介绍 2. 利用大模型进行知识提取 3. 大模型作为教师模型 4. Q&A 分享嘉宾|胡斌斌 蚂蚁集团AI创新研发部门NextEvo 算法专家 编辑整理|王甲君 内容校对| 阅读全文

posted @ 2025-03-19 16:52 ExplorerMan 阅读(457) 评论(0) 推荐(0)

EmoLLM-心理健康大模型
摘要:EmoLLM 是一系列能够支持 理解用户-支持用户-帮助用户 心理健康辅导链路的心理健康大模型,由 LLM指令微调而来,欢迎大家star~⭐⭐。目前已经开源的 LLM 微调配置如下: 心理健康大模型(Mental Health Grand Model)是一个综合性的概念,它旨在全面理解和促进个体、群 阅读全文

posted @ 2025-03-19 16:30 ExplorerMan 阅读(145) 评论(0) 推荐(0)

PingCAP 王琦智:下一代 RAG,tidb.ai 使用知识图谱增强 RAG 能力
摘要:导读 随着 ChatGPT 的流行,LLMs(大语言模型)再次进入人们的视野。然而,在处理特定领域查询时,大模型生成的内容往往存在信息滞后和准确性不足的问题。如何让 RAG 和向量搜索技术在实际应用中更好地满足企业需求?如何在向量之上构建全链路 RAG 服务,提升开发者效率,降低成本?本文整理自 T 阅读全文

posted @ 2025-03-18 23:28 ExplorerMan 阅读(118) 评论(0) 推荐(0)

万字长文分享快手 Kolors 可图大模型应用实践
摘要:在企业提效方面,多模态能力同样具有重要意义。在 AICon 北京站活动中,我们邀请了快手「可图」大模型负责人李岩,他分享了主题为《快手「可图」文生图大模型应用实践》的演讲内容,以下为李岩演讲内容~期待对你有所启发! 另外,在 8 月 18-19 日即将举办的 AICon 全球人工智能开发与应用大会上 阅读全文

posted @ 2025-03-18 23:20 ExplorerMan 阅读(101) 评论(0) 推荐(0)

导航