随笔分类 -  深度学习

1
摘要:https://arxiv.org/abs/2507.21046 摘要 大型语言模型(LLMs)在多种任务中展现了卓越的能力,但其本质上是静态的,无法根据新任务、不断变化的知识领域或动态交互环境自适应地调整内部参数。随着LLMs越来越多地应用于开放式、交互式环境,这种静态特性已成为关键瓶颈,亟需能够 阅读全文
posted @ 2025-08-22 14:24 一介布衣、 阅读(45) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.20416 https://github.com/open-sciencelab/GraphGen 摘要 大规模语言模型(LLM)的微调通常需要大量高质量的有监督数据,而这些数据的获取既昂贵又耗时。尽管合成数据生成已成为一种有前景的解决方案,但现 阅读全文
posted @ 2025-08-13 10:34 一介布衣、 阅读(92) 评论(0) 推荐(0)
摘要:https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus 中文版的是低级的机翻。这个是使用GPT4.1的翻译结果,并加上了富文本标记。 Manus 上下文工程经验 背景与抉择 在项目伊始,我 阅读全文
posted @ 2025-07-21 10:40 一介布衣、 阅读(64) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.00675 摘要 记忆是人工智能系统的基础组成部分,支撑着基于大语言模型(LLMs)的智能体。以往的综述多聚焦于记忆在LLM中的应用(如实现对话智能体的个性化记忆),但往往忽略了驱动记忆动态变化的基本操作。本文首先将记忆表示划分为参数化和上下文两 阅读全文
posted @ 2025-07-20 12:21 一介布衣、 阅读(155) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2507.02029 摘要 我们介绍了RoboBrain 2.0,这是我们最新一代的具身视觉-语言基础模型,旨在为物理环境中的复杂具身任务统一感知、推理与规划。RoboBrain 2.0 提供了两个版本:轻量级的 7B 模型和全规模的 32B 模型,采用异 阅读全文
posted @ 2025-07-07 13:54 一介布衣、 阅读(218) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2506.18096v1 Deep Research Agents: A Systematic Examination And Roadmap 摘要 大型语言模型(LLMs)的快速发展催生了一类全新的自主AI系统,被称为深度研究(Deep Research 阅读全文
posted @ 2025-06-30 14:04 一介布衣、 阅读(412) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.10468v1 摘要 本综述批判性地区分了AI Agents与Agentic AI,提供了结构化的概念分类、应用映射和挑战分析,以澄清它们不同的设计理念和能力。我们首先概述了检索策略和基础定义,将AI Agents描述为由LLM和LIM驱动、面向 阅读全文
posted @ 2025-06-26 15:28 一介布衣、 阅读(265) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.22050 摘要 具身规划要求智能体基于动态视觉观测和自然语言目标做出连贯的多步决策。尽管最新的视觉-语言模型(VLM)在静态感知任务上表现优异,但它们在具身环境中的时序推理、空间理解和常识落地等方面仍然存在明显短板。本文提出了一种将R1风格推理 阅读全文
posted @ 2025-06-17 10:24 一介布衣、 阅读(49) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.03673 https://github.com/FlagOpen/RoboOS 摘要 具身智能的兴起为新一代工业生态系统中的多智能体协作带来了前所未有的需求,推动了自主制造、自适应服务机器人以及网络物理生产架构等范式的变革。 然而,当前的机器人 阅读全文
posted @ 2025-06-13 15:15 一介布衣、 阅读(159) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.22648 https://github.com/Alibaba-NLP/WebAgent 摘要 应对复杂的现实世界问题需要深入的信息检索和多步推理。近期在智能体系统方面的进展,以 Deep Research 为代表,凸显了自主多步研究的潜力。在 阅读全文
posted @ 2025-05-30 18:39 一介布衣、 阅读(250) 评论(0) 推荐(0)
摘要:https://blog.csdn.net/qq_38961840/article/details/145384852 https://arxiv.org/abs/2402.03300 强化学习中的基本概念 智能体、环境与交互 在传统的强化学习框架中,我们通常有一个智能体(Agent) 和一个环境( 阅读全文
posted @ 2025-05-27 14:49 一介布衣、 阅读(300) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2505.16854 https://github.com/kokolerk/TON 摘要 强化学习(RL)已被证明是提高视觉-语言模型(VLMs)推理能力的有效后训练策略。组相对策略优化(GRPO)是一种近期突出的方法,通过鼓励模型在回答之前生成完整的推 阅读全文
posted @ 2025-05-27 10:31 一介布衣、 阅读(138) 评论(0) 推荐(0)
摘要:https://github.com/QwenLM/Qwen3 核心创新: Qwen3 的“思维模式融合”是通过以下几个关键技术手段实现的: 持续监督微调(SFT) 在已经具备推理能力的模型(经过推理RL训练)上,继续用包含“思维”和“非思维”两类数据的混合数据集进行SFT。 “思维”数据:用第二阶 阅读全文
posted @ 2025-05-15 10:05 一介布衣、 阅读(1104) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2502.13923 https://github.com/QwenLM/Qwen2.5-VL 摘要 我们介绍 Qwen2.5-VL,这是 Qwen 视觉-语言系列的最新旗舰模型,展示了基础能力和创新功能方面的显著进步。Qwen2.5-VL 在通过增强的视 阅读全文
posted @ 2025-05-13 10:21 一介布衣、 阅读(1863) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2503.21696 摘要 近期的深度思维模型在数学和编程任务中展现出卓越的推理能力。然而,这些模型在需要通过图像-动作交织轨迹与环境进行连续交互的具身领域中的有效性仍然未被探索。我们提出了具身推理器(Embodied Reasoner),该模型将 o1 阅读全文
posted @ 2025-05-07 11:26 一介布衣、 阅读(184) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2504.10479 摘要 我们介绍InternVL3,这是InternVL系列的一个重要进展,采用了原生的多模态预训练范式。与将纯文本大型语言模型(LLM)改编为支持视觉输入的多模态大型语言模型(MLLM)不同,InternVL3在单一预训练阶段中,同时 阅读全文
posted @ 2025-04-25 15:29 一介布衣、 阅读(718) 评论(0) 推荐(0)
摘要:https://openai.com/index/gpt-4-1 【openai的技术报告越来越没意思了,除了秀肌肉,没有干货】 引言 今天我们正式发布API中的三个新模型:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。这些模型在各方面均优于GPT-4.0和GPT-4.0 阅读全文
posted @ 2025-04-22 11:28 一介布衣、 阅读(253) 评论(0) 推荐(0)
摘要:http://arxiv.org/pdf/2312.14860v1 摘要 在语音识别系统中,语音活动检测(VAD)是一个至关重要的前端模块。针对传统基于DFSMN的二值VAD系统在噪声鲁棒性方面的不足,本文进一步提出了基于多任务学习的改进模型的语义VAD,以满足实时和离线系统的特定应用需求。内部数据 阅读全文
posted @ 2025-04-16 17:32 一介布衣、 阅读(411) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2502.09560 https://embodiedbench.github.io 摘要 利用多模态大型语言模型(MLLMs)创建具身代理提供了一个有前途的解决现实世界任务的途径。尽管语言为中心的具身代理已经引起了广泛关注,但由于缺乏全面的评估框架,基于 阅读全文
posted @ 2025-04-10 17:43 一介布衣、 阅读(192) 评论(0) 推荐(0)
摘要:https://arxiv.org/abs/2501.15068 摘要 实体操控是实体人工智能领域的一项基本能力。尽管当前的实体操控模型在特定环境中表现出一定的泛化能力,但由于现实世界场景的复杂性和多样性,它们在新环境和任务中仍面临挑战。传统的端到端数据收集和训练方式导致了对大量数据的需求。将端到端 阅读全文
posted @ 2025-03-16 16:00 一介布衣、 阅读(130) 评论(0) 推荐(0)

1