海棠庭院又春深

2025年10月25日

Paper: SALT: Step-level Advantage Assignment for Long-horizon Agents via Trajectory Graph

摘要：中文标题：SALT：通过轨迹图为长程智能体进行步级优势分配作者机构：Jiazheng Li, et al. University of Connecticut, Amazon 论文地址：https://arxiv.org/pdf/2510.20022v1 论文贡献： 1）提出SALT，一个用于长程阅读全文

posted @ 2025-10-25 15:52 海棠庭院又春深阅读(22) 评论(0) 推荐(0)

Paper: Learning Affordances at Inference-Time for Vision-Language-Action Models

摘要： **中文标题：** 视觉-语言-动作模型的推理时间可供性学习 **作者机构：** Ameesh Shah¹, William Chen¹, Adwait Godbole¹, Federico Mora¹, Sanjit A. Seshia¹, Sergey Levine¹,² (加州大学伯克利分校) 阅读全文

posted @ 2025-10-25 15:40 海棠庭院又春深阅读(58) 评论(0) 推荐(0)

Paper: Diffusion Transformers with Representation Autoencoders

摘要： **1 Diffusion Transformers with Representation Autoencoders** **中文标题：** 带有表征自动编码器的扩散 Transformer **作者机构：** Boyang Zheng, Nanye Ma, Shengbang Tong, Sai 阅读全文

posted @ 2025-10-25 15:30 海棠庭院又春深阅读(69) 评论(0) 推荐(0)

Paper: Accelerating Vision Transformers with Adaptive Patch Sizes

摘要：作者机构：Rohan Choudhury, et al. Carnegie Mellon University, KAIST, General Robotics 论文地址：[https://arxiv.org/pdf/2510.18091v1](https://arxiv.org/pdf/2510. 阅读全文

posted @ 2025-10-25 10:36 海棠庭院又春深阅读(42) 评论(0) 推荐(0)

Paper: Extracting alignment data in open models

摘要：这篇论文的核心观点在于，对开放权重的大型语言模型 (LLMs) 来说，能够有效地提取用于模型对齐的训练数据。研究人员通过利用在模型后训练阶段引入的聊天模板和特殊标记，能够有效地促使模型“反刍”出类似对齐数据的信息。论文的主要发现和贡献包括： * **数据提取的有效性**：研究表明，通过这种方法可以阅读全文

posted @ 2025-10-25 10:18 海棠庭院又春深阅读(23) 评论(1) 推荐(0)

海棠庭院又春深

公告