会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一介布衣、
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
下一页
2025年8月17日
【综述】VLA模型:概念、进展、应用与挑战
摘要: https://arxiv.org/abs/2505.04769 摘要 视觉-语言-动作(Vision-Language-Action, VLA)模型标志着人工智能领域的变革性进展,旨在将感知、自然语言理解与具身动作统一于单一计算框架之中。本文作为基础性综述,系统梳理了近年来VLA模型的最新进展,并
阅读全文
posted @ 2025-08-17 16:06 一介布衣、
阅读(5613)
评论(2)
推荐(3)
2025年8月14日
【综述】大模型后训练综述
摘要: https://arxiv.org/abs/2503.06072 摘要 大型语言模型(LLMs)的出现彻底改变了自然语言处理,使其在从对话系统到科学探索等各领域中变得不可或缺。然而,其预训练架构在特定场景下常暴露出诸多局限,包括推理能力受限、伦理风险不明以及领域适应性不足等问题。这些挑战促使先进的后
阅读全文
posted @ 2025-08-14 14:55 一介布衣、
阅读(495)
评论(0)
推荐(0)
2025年8月13日
GraphGen:通过知识驱动的合成数据生成增强大语言模型的监督微调
摘要: https://arxiv.org/abs/2505.20416 https://github.com/open-sciencelab/GraphGen 摘要 大规模语言模型(LLM)的微调通常需要大量高质量的有监督数据,而这些数据的获取既昂贵又耗时。尽管合成数据生成已成为一种有前景的解决方案,但现
阅读全文
posted @ 2025-08-13 10:34 一介布衣、
阅读(372)
评论(0)
推荐(0)
2025年8月11日
RoboMemory:一种受大脑启发的面向物理实体系统中的终身学习的多记忆智能体框架
摘要: 摘要 我们提出了RoboMemory:一种受大脑启发的多记忆框架,面向物理实体系统中的终身学习,解决了真实环境中的关键挑战:持续学习、多模块记忆延迟、任务相关性建模,以及闭环规划中的无限循环问题。RoboMemory基于认知神经科学,集成了四大核心模块:信息预处理器(类丘脑)、终身实体记忆系统(类海
阅读全文
posted @ 2025-08-11 11:34 一介布衣、
阅读(248)
评论(0)
推荐(0)
2025年7月21日
MANUS 上下文工程经验
摘要: https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus 中文版的是低级的机翻。这个是使用GPT4.1的翻译结果,并加上了富文本标记。 Manus 上下文工程经验 背景与抉择 在项目伊始,我
阅读全文
posted @ 2025-07-21 10:40 一介布衣、
阅读(111)
评论(0)
推荐(0)
2025年7月20日
【综述】重新思考人工智能中的记忆:分类、操作、主题与未来方向
摘要: https://arxiv.org/abs/2505.00675 摘要 记忆是人工智能系统的基础组成部分,支撑着基于大语言模型(LLMs)的智能体。以往的综述多聚焦于记忆在LLM中的应用(如实现对话智能体的个性化记忆),但往往忽略了驱动记忆动态变化的基本操作。本文首先将记忆表示划分为参数化和上下文两
阅读全文
posted @ 2025-07-20 12:21 一介布衣、
阅读(436)
评论(0)
推荐(1)
2025年7月17日
Infini-Thor 具身大海捞针:长上下文推理的环境、架构和训练考虑
摘要: https://arxiv.org/pdf/2505.16928 摘要 我们提出了 infini-thor,这是一个面向长时序具身任务的新框架,旨在推动具身人工智能中的长上下文理解能力。infini-thor 提供了: (1) 一个可扩展、可复现且无限制生成长时序轨迹的生成框架; (2) 一个新颖的
阅读全文
posted @ 2025-07-17 10:09 一介布衣、
阅读(78)
评论(0)
推荐(0)
2025年7月7日
RoboBrain2.0 技术报告
摘要: https://arxiv.org/abs/2507.02029 摘要 我们介绍了RoboBrain 2.0,这是我们最新一代的具身视觉-语言基础模型,旨在为物理环境中的复杂具身任务统一感知、推理与规划。RoboBrain 2.0 提供了两个版本:轻量级的 7B 模型和全规模的 32B 模型,采用异
阅读全文
posted @ 2025-07-07 13:54 一介布衣、
阅读(467)
评论(0)
推荐(0)
2025年7月4日
Pi0.5:具有开放世界泛化能力的视觉-语言-动作模型
摘要: https://arxiv.org/abs/2504.16054 摘要 为了让机器人真正有用,它们必须能够在现实世界中执行实际相关的任务,而不仅仅是在实验室中。尽管视觉-语言-动作(VLA)模型在端到端机器人控制方面取得了令人瞩目的进展,我们提出了\(\pi_{0.5}\),这是一个基于\(\pi_
阅读全文
posted @ 2025-07-04 14:50 一介布衣、
阅读(1108)
评论(0)
推荐(0)
2025年6月30日
深度研究智能体:系统性综述与发展路线图
摘要: https://arxiv.org/abs/2506.18096v1 Deep Research Agents: A Systematic Examination And Roadmap 摘要 大型语言模型(LLMs)的快速发展催生了一类全新的自主AI系统,被称为深度研究(Deep Research
阅读全文
posted @ 2025-06-30 14:04 一介布衣、
阅读(808)
评论(0)
推荐(0)
上一页
1
2
3
4
5
下一页
公告