会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一介布衣、
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
下一页
2025年8月11日
RoboMemory:一种受大脑启发的面向物理实体系统中的终身学习的多记忆智能体框架
摘要: 摘要 我们提出了RoboMemory:一种受大脑启发的多记忆框架,面向物理实体系统中的终身学习,解决了真实环境中的关键挑战:持续学习、多模块记忆延迟、任务相关性建模,以及闭环规划中的无限循环问题。RoboMemory基于认知神经科学,集成了四大核心模块:信息预处理器(类丘脑)、终身实体记忆系统(类海
阅读全文
posted @ 2025-08-11 11:34 一介布衣、
阅读(84)
评论(0)
推荐(0)
2025年7月21日
MANUS 上下文工程经验
摘要: https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus 中文版的是低级的机翻。这个是使用GPT4.1的翻译结果,并加上了富文本标记。 Manus 上下文工程经验 背景与抉择 在项目伊始,我
阅读全文
posted @ 2025-07-21 10:40 一介布衣、
阅读(77)
评论(0)
推荐(0)
2025年7月20日
【综述】重新思考人工智能中的记忆:分类、操作、主题与未来方向
摘要: https://arxiv.org/abs/2505.00675 摘要 记忆是人工智能系统的基础组成部分,支撑着基于大语言模型(LLMs)的智能体。以往的综述多聚焦于记忆在LLM中的应用(如实现对话智能体的个性化记忆),但往往忽略了驱动记忆动态变化的基本操作。本文首先将记忆表示划分为参数化和上下文两
阅读全文
posted @ 2025-07-20 12:21 一介布衣、
阅读(234)
评论(0)
推荐(1)
2025年7月17日
Infini-Thor 具身大海捞针:长上下文推理的环境、架构和训练考虑
摘要: https://arxiv.org/pdf/2505.16928 摘要 我们提出了 infini-thor,这是一个面向长时序具身任务的新框架,旨在推动具身人工智能中的长上下文理解能力。infini-thor 提供了: (1) 一个可扩展、可复现且无限制生成长时序轨迹的生成框架; (2) 一个新颖的
阅读全文
posted @ 2025-07-17 10:09 一介布衣、
阅读(43)
评论(0)
推荐(0)
2025年7月7日
RoboBrain2.0 技术报告
摘要: https://arxiv.org/abs/2507.02029 摘要 我们介绍了RoboBrain 2.0,这是我们最新一代的具身视觉-语言基础模型,旨在为物理环境中的复杂具身任务统一感知、推理与规划。RoboBrain 2.0 提供了两个版本:轻量级的 7B 模型和全规模的 32B 模型,采用异
阅读全文
posted @ 2025-07-07 13:54 一介布衣、
阅读(290)
评论(0)
推荐(0)
2025年7月4日
Pi0.5:具有开放世界泛化能力的视觉-语言-动作模型
摘要: https://arxiv.org/abs/2504.16054 摘要 为了让机器人真正有用,它们必须能够在现实世界中执行实际相关的任务,而不仅仅是在实验室中。尽管视觉-语言-动作(VLA)模型在端到端机器人控制方面取得了令人瞩目的进展,我们提出了\(\pi_{0.5}\),这是一个基于\(\pi_
阅读全文
posted @ 2025-07-04 14:50 一介布衣、
阅读(466)
评论(0)
推荐(0)
2025年6月30日
深度研究智能体:系统性综述与发展路线图
摘要: https://arxiv.org/abs/2506.18096v1 Deep Research Agents: A Systematic Examination And Roadmap 摘要 大型语言模型(LLMs)的快速发展催生了一类全新的自主AI系统,被称为深度研究(Deep Research
阅读全文
posted @ 2025-06-30 14:04 一介布衣、
阅读(511)
评论(0)
推荐(0)
2025年6月27日
EmbodiedEval: 评估多模态大语言模型作为具身代理的能力
摘要: https://arxiv.org/abs/2501.11858 https://github.com/thunlp/EmbodiedEval 摘要 多模态大语言模型(MLLMs)近年来取得了显著进展,为具身智能体的发展带来了广阔前景。目前用于评估MLLMs的基准主要采用静态图像或视频,评测场景局限
阅读全文
posted @ 2025-06-27 14:24 一介布衣、
阅读(54)
评论(0)
推荐(0)
2025年6月26日
AI Agents vs Agentic AI:概念分类、应用及挑战
摘要: https://arxiv.org/abs/2505.10468v1 摘要 本综述批判性地区分了AI Agents与Agentic AI,提供了结构化的概念分类、应用映射和挑战分析,以澄清它们不同的设计理念和能力。我们首先概述了检索策略和基础定义,将AI Agents描述为由LLM和LIM驱动、面向
阅读全文
posted @ 2025-06-26 15:28 一介布衣、
阅读(305)
评论(0)
推荐(0)
2025年6月20日
EmbodiedBench:面向视觉驱动具身代理的多模态大语言模型综合评估体系
摘要: https://arxiv.org/abs/2502.09560 https://embodiedbench.github.io/ 摘要 利用多模态大语言模型(MLLMs)构建具身智能体为解决现实世界任务提供了有前景的途径。尽管以语言为中心的具身智能体已受到广泛关注,但由于缺乏全面的评测框架,基于M
阅读全文
posted @ 2025-06-20 16:45 一介布衣、
阅读(151)
评论(0)
推荐(0)
上一页
1
2
3
4
下一页
公告