刷新
构建YouTube视频总结摘要智能体

博主头像 智能体 AI 平台 智能体 AI 框架是一个工具包,用于创建能够通过工具使用和记忆自主或半自主地推理、计划和采取行动的智能体系统。这些框架提供了创建能够与环境交互、做出决策和执行任务的智能体所需的结构。有几个流行的智能体 AI 平台,如 LangChain、CrewAI 和 Phidata。在本教程 ...

Search-R1论文浅析与代码实现

博主头像 GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ ...

OpenAI Codex整合Z.ai GLM-4.6编程

博主头像 背景 OpenAI Codex 是一个由 OpenAI 开发的人工智能模型,它能够理解自然语言(比如中文、英文)指令,并将其实时翻译成可工作的计算机代码。简单来说,你用日常语言告诉它你想要实现什么功能,它就能为你写出代码。技术基础: Codex 是基于 OpenAI 的 GPT-3(生成式预训练变换 ...

DAPO代码实现浅析

博主头像 参考verl对dapo的实现,首先咱们看一下入口.sh和.py文件,在./recipe/dapo/文件夹中有以下目录 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...

DAPO浅析

博主头像 论文地址 https://arxiv.org/abs/2503.14476 参考实验:DAPO + vLLM v1 + VeRL —— VOC性能比较 Motivation 没有完整的GRPO训练R1-32B的框架 目标: 降低错误样本的长度 (token-level loss) 训练更加稳定 (o ...

DeepResearch代码浅析

博主头像 DeepResearch代码浅析 概述 代码:DeepResearch 主要看一下inference下面的ReAct推理流程。 inference ├── eval_data │ ├── example_with_file.jsonl │ ├── example.jsonl │ └── file_c ...

微软智能体框架(Microsoft Agent Framework)介绍

博主头像 背景 微软智能体框架(Microsoft Agent Framework)进行全面深入的分析。该框架于2025年10月1日发布公共预览版,标志着微软在人工智能智能体技术领域的一次重大战略整合 。其核心使命在于解决人工智能领域长期存在的“研究”与“生产”之间的鸿沟,将以研究为驱动、具备动态多代理编排能 ...

Salesforce实践AI驱动下的4个工程启示

博主头像 引言:当软件测试达到极限 在现代软件开发中,自动化测试是质量保障的基石,但它也带来了一个普遍的挑战:海量的测试失败案例。当系统规模达到一定程度时,诊断和修复这些失败案例本身就可能成为一个巨大的工程瓶瓶颈,拖慢整个开发节奏。 Salesforce的工程团队对此深有体会。他们的测试生态系统规模惊人:每天 ...

AgentFounder浅析——Agent的演化历程与目标

博主头像 理论上(浅显)分析Agent与传统llm、RAG的不同以及演进历程,根据Agent的目标解读AgentFounder论文的训练策略和数据集构建 Agent的目标以及对应的技术方案 Agent的推理目标 形式化的表达: 咱们首先来分析一下最开始大模型的功能,即仅根据\(\pi\)的内部知识和问题\(q ...

云Pinecone向量数据库集成SpringAI

博主头像 RAG实现架构图Pinecone面板查询QPS峰值插入模型 llama-text-embed-v2 是由NVIDIA Research开发的一款先进的文本嵌入模型,旨在提供高质量的检索能力和低延迟的推理性能。该模型也被称为 llama-3_2-nv-embedqa-1b-v2,它基于Llama 3. ...

别再怪AI答非所问了!5分钟掌握Prompt,让你的AI从“人工智障”秒变“人工智能”

博主头像 是不是有过这种经历?你让AI写个“霸气侧漏”的辞职信,它却给你一篇“感恩公司”的温情小作文;你让AI画个“在咖啡馆敲代码的程序员”,结果生成一个“像在打游戏的奥特曼”…… 先别急着给AI扣上“智商不行”的帽子——90%的问题,可能都出在您给它的“指令”上。 这道指令,就是今天的主角:Prompt(提 ...

Qwen WebAgent 系列

博主头像 GitHub地址: https://github.com/Alibaba-NLP/WebAgent# 共有5篇系列文章 为Agent(React架构)在web search(Deepsearch)提供BenchMark以及模型训练方法。 WebWalker 将原始instruct-answer的si ...

AI图片生成思路

博主头像 AI图片生成思路指导思路先寻找真实图片,发送到AI进行描述照片描述:這張照片的主角是四隻毛茸茸的柴犬,牠們一起棲息在一個紅磚矮牆上。狗狗的姿態與顏色:畫面從左至右,第一隻是常見的赤色柴犬,牠舒適地趴著,兩隻前腳懸在牆外,表情看起來很放鬆。第二隻是一隻黑柴,坐姿端正,直視著鏡頭。最引人注目的是中間那隻 ...

Google Veo3生成跳舞视频

博主头像 背景 Google Veo 3 是谷歌 DeepMind 于 2025 年 5 月推出的第三代 AI 视频生成模型,在视听同步、画质表现、创作控制等方面实现了显著突破, 视听协同生成 原生音频同步技术:支持文本或图像生成视频时同步创建多维度音频,包括对话、环境噪音、音效及背景音乐。例如输入 “雨天咖 ...

大模型在软件研发协同演进

博主头像 大模型在软件研发领域的应用AI时代软件工程变革与智能化发展趋势智能体能力逐渐成熟人机协同办公场景联动研发工作流,人机交互模式变革研发数字员工研发基础建设案例自动CR测试场景研发场景研发通用界面发展趋势AI不再是工具,而是你的同事:你必须知道的软件工程5大变革1.0 引言:从AI助手到AI同事的进化如 ...

<1···345···29>