为什么所有人的机器人都在叠衣服?这说明了现代机器人学习处于怎样的状态?

转载链接:The Fascination With Robots Folding Clothes Explained - IEEE Spectrum

image

 似乎每周都会出现机器人叠衣服的新视频。例如Weave Robotics在X平台发布的半自主操作演示就令人惊艳 

这段演示确实惊艳,但涉足该领域的企业远不止Weave一家。Figure 02在叠衣服,Figure 03也在叠衣服。Physical Intelligence公司发布其旗舰视觉-语言-动作模型pi0时,配套展示的正是机器人从洗衣机取出衣物后熟练折叠的惊艳视频。在各类机器人博览会上,你也能亲眼目睹叠衣机器人的现场演示。早在这些展示之前,谷歌在ALOHA项目研究中就已演示过衣物折叠功能。7X科技公司甚至计划推出商用叠衣机器人!

除了实际折叠衣物,还有类似叠餐巾这样的衍生任务——Dyna公司的餐巾折叠演示创下连续18小时运行的记录,堪称我心目中的年度最佳机器人视频。这就引出一个问题:为何这些机器人公司突然都热衷于折叠操作?

原因一:这在过去根本不可能实现。

回溯过去十多年的研究,确实出现过一些机器人折叠衣物的技术展示。但这些演示方案极其脆弱、效率低下,远未达到可投入实际应用的水平。早期的解决方案(甚至包括基于学习的方法!)往往依赖精确的相机标定或精心设计的人工特征,这意味着这些叠衣演示通常只能在特定机器人、特定环境中运行,且可能仅成功过一次——仅仅是为了录制演示视频或提交论文而勉强完成。

 

image

 早在2014年,PR2机器人就借助一件独具创意的图案衬衫,成功实现了衣物折叠。Bosch/IEEE

看看加州大学伯克利分校2014年这个PR2折叠衣物的示例。这款机器人当时确实采用了神经网络策略,但该策略规模小且脆弱:它只能在固定绿色背景前进行物品抓取和放置,动作极其缓慢,且无法处理多种款式的衬衫。要实现实际应用,就需要更大规模的模型、基于网络规模数据的预训练,以及更优质通用的模仿学习技术。

因此十年后的今天,在获得适当演示数据的前提下,众多初创公司和研究实验室都能实现衣物折叠演示——我们已见证无数爱好者与企业运用大体相似的工具(如HuggingFace的LeRobot),在无需高度专业化定制的条件下达成这一目标。

 

原因二:视觉效果惊艳且需求旺盛!

 

许多从事机器人领域的研究者心中都有一个终极理想——打造能包揽所有繁琐家务的机器人管家。只要提及叠衣服这个话题,无数人都会纷纷表示再也不想亲手折叠衣物,甚至不惜重金也要实现这个愿望。

 

这对相关企业而言也至关重要。像Figure和1X这样的公司基于"实现多种工作自动化"的理念筹集了大量资金,而现在它们正日益将目光聚焦于家庭场景。

 

image

 机器人技术已经能够永无止境地折叠无限数量的餐巾。Dyna Robotics

 这些演示的精妙之处正在于此。尽管它们动作缓慢且不够完美,但所有人都能从中预见这项技术如何蜕变成我们梦寐以求的模样:一个能融入家庭生活、化解那些占据我们时间的日常琐事的机器人。

原因三:它巧妙地绕开了机器人至今仍不擅长的领域。

这些机器人行为是通过模仿学习训练的模型所产生的。现代模仿学习方法(如Diffusion Policy)借鉴生成式AI技术,基于人类专家示范行为生成复杂灵巧的机器人轨迹——这往往需要海量的示范数据。谷歌的ALOHA Unleashed项目就是典型例证:仅学习系鞋带这个动作就需要约6000次示范记录。在每次示范过程中,人类操作者操控一对机械臂执行任务,所有数据最终被用于训练行为策略。

需要特别关注这些演示背后的技术难点。人类示范动作既不可能完美无缺,也无法保持绝对一致性——例如两位操作者抓取物体时,永远无法实现亚毫米级的完全一致抓取点位。这种特性对于需要精密装配(如给设备安装防护盖)的任务可能构成障碍,但对容错率较高的叠衣任务则完全不成问题。由此产生两个连锁效应:

Ÿ 收集叠衣演示数据更为便捷——无需因毫米级误差而废弃任何训练样本;

Ÿ 可采用成本更低、重复精度较低的硬件完成相同任务。这对需要快速部署机器人集群收集海量数据的企业,或预算有限的小型团队而言意义非凡!

基于相同原理,叠衣任务的优势在于可以精准固定摄像头位置。在学习新技能时,训练样本需要对接实际应用场景的环境空间实现"全面覆盖"。因此对环境控制力越强,学习过程就越高效——所需数据量更少,也更容易获得惊艳的演示效果。当您看到机器人在纯色桌面或极简背景下折叠衣物时,请记住这不仅是构图美观,更是为机器人提供了至关重要的操作便利!

由于我们需要收集海量数据——往往持续数十小时——才能完善任务执行,过程中难免出现失误。此时任务是否易于重置显得尤为重要,即能否快速恢复到可重新尝试的初始状态。叠衣服任务在这方面具有天然优势:若折叠过程中出现差错,只需拾起衣物轻轻一抖即可重置任务。这与整理橱柜玻璃杯的场景形成鲜明对比——倘若碰倒堆叠的杯子或失手摔碎,后果将十分棘手

叠衣任务还能有效避免与环境的强力接触。一旦涉及高强度压力,不仅可能导致物品损坏、任务状态无法重置,更因力量参数难以被策略准确捕捉,致使示范数据收集难度激增。而每个变量(如施加力量的强弱)最终都会要求更多数据支撑,以确保模型能覆盖所有预期操作情境。

 

未来可期

尽管如今叠衣演示层出不穷,但其中不少仍令我深感震撼。如前所述,Dyna的演示是我今年的最爱之一,这主要因为能持久运行的机器人策略至今仍属凤毛麟角。但该团队在旧金山Actuate大会与首尔机器人学习大会等多个场合成功展示了零样本折叠(即无需额外训练数据即可折叠),这确实令人惊叹——即便在当今机器人领域也实属突破性成果。

展望未来,我们有理由期待机器人能应对更具挑战性、更动态的环境交互:在执行操作任务时实现更快速移动、搬运重物,以及在崎岖地形攀爬或应对恶劣环境。

但就目前而言,我们需要认识到现代学习方法各有其优势与局限。虽然衣物折叠并非易事,但这类任务恰好与我们现有模型的能力高度契合。因此,未来我们必将见证更多此类应用的涌现。

产品名称

购买链接

智能佳机械臂 Mobile ALOHA 斯坦福机械臂 完整复刻版 复合机器人 远程操控机械臂ROS开源学习实验平台 Mobile ALOHA 机械臂

https://item.jd.com/10100493559285.html

 

智能佳ALOHA2 完整套装 斯坦福官方正统 双臂协作 深度学习与家政ROS开源科研平台 具身智能实验设备 ALOHA 2 机械臂【开箱即用】

https://item.jd.com/10097978503518.html

 

您对此产品感兴趣,请联系我们!

智能佳机器人

400 099 1872

010-82488500/82488501

www.bjrobot.com

 

京东店铺:智能佳机器人专营店 - 京东 (jd.com)

淘宝店铺:首页-智能佳机器人-淘宝网 (taobao.com)

企业淘宝:首页-智能佳机器人官方店铺-淘宝网 (taobao.com)

 

 

 

posted @ 2025-11-27 16:52  智能佳机器人  阅读(33)  评论(0)    收藏  举报