为什么所有人的机器人都在叠衣服？这说明了现代机器人学习处于怎样的状态？

转载链接：The Fascination With Robots Folding Clothes Explained - IEEE Spectrum

似乎每周都会出现机器人叠衣服的新视频。例如Weave Robotics在X平台发布的半自主操作演示就令人惊艳

这段演示确实惊艳，但涉足该领域的企业远不止Weave一家。Figure 02在叠衣服，Figure 03也在叠衣服。Physical Intelligence公司发布其旗舰视觉-语言-动作模型pi0时，配套展示的正是机器人从洗衣机取出衣物后熟练折叠的惊艳视频。在各类机器人博览会上，你也能亲眼目睹叠衣机器人的现场演示。早在这些展示之前，谷歌在ALOHA项目研究中就已演示过衣物折叠功能。7X科技公司甚至计划推出商用叠衣机器人！

除了实际折叠衣物，还有类似叠餐巾这样的衍生任务——Dyna公司的餐巾折叠演示创下连续18小时运行的记录，堪称我心目中的年度最佳机器人视频。这就引出一个问题：为何这些机器人公司突然都热衷于折叠操作？

原因一：这在过去根本不可能实现。

回溯过去十多年的研究，确实出现过一些机器人折叠衣物的技术展示。但这些演示方案极其脆弱、效率低下，远未达到可投入实际应用的水平。早期的解决方案（甚至包括基于学习的方法！）往往依赖精确的相机标定或精心设计的人工特征，这意味着这些叠衣演示通常只能在特定机器人、特定环境中运行，且可能仅成功过一次——仅仅是为了录制演示视频或提交论文而勉强完成。

早在2014年，PR2机器人就借助一件独具创意的图案衬衫，成功实现了衣物折叠。Bosch/IEEE

看看加州大学伯克利分校2014年这个PR2折叠衣物的示例。这款机器人当时确实采用了神经网络策略，但该策略规模小且脆弱：它只能在固定绿色背景前进行物品抓取和放置，动作极其缓慢，且无法处理多种款式的衬衫。要实现实际应用，就需要更大规模的模型、基于网络规模数据的预训练，以及更优质通用的模仿学习技术。

因此十年后的今天，在获得适当演示数据的前提下，众多初创公司和研究实验室都能实现衣物折叠演示——我们已见证无数爱好者与企业运用大体相似的工具（如HuggingFace的LeRobot），在无需高度专业化定制的条件下达成这一目标。

原因二：视觉效果惊艳且需求旺盛！

许多从事机器人领域的研究者心中都有一个终极理想——打造能包揽所有繁琐家务的机器人管家。只要提及叠衣服这个话题，无数人都会纷纷表示再也不想亲手折叠衣物，甚至不惜重金也要实现这个愿望。

这对相关企业而言也至关重要。像Figure和1X这样的公司基于"实现多种工作自动化"的理念筹集了大量资金，而现在它们正日益将目光聚焦于家庭场景。

机器人技术已经能够永无止境地折叠无限数量的餐巾。Dyna Robotics

这些演示的精妙之处正在于此。尽管它们动作缓慢且不够完美，但所有人都能从中预见这项技术如何蜕变成我们梦寐以求的模样：一个能融入家庭生活、化解那些占据我们时间的日常琐事的机器人。

原因三：它巧妙地绕开了机器人至今仍不擅长的领域。

这些机器人行为是通过模仿学习训练的模型所产生的。现代模仿学习方法（如Diffusion Policy）借鉴生成式AI技术，基于人类专家示范行为生成复杂灵巧的机器人轨迹——这往往需要海量的示范数据。谷歌的ALOHA Unleashed项目就是典型例证：仅学习系鞋带这个动作就需要约6000次示范记录。在每次示范过程中，人类操作者操控一对机械臂执行任务，所有数据最终被用于训练行为策略。

需要特别关注这些演示背后的技术难点。人类示范动作既不可能完美无缺，也无法保持绝对一致性——例如两位操作者抓取物体时，永远无法实现亚毫米级的完全一致抓取点位。这种特性对于需要精密装配（如给设备安装防护盖）的任务可能构成障碍，但对容错率较高的叠衣任务则完全不成问题。由此产生两个连锁效应：

Ÿ 收集叠衣演示数据更为便捷——无需因毫米级误差而废弃任何训练样本；

Ÿ 可采用成本更低、重复精度较低的硬件完成相同任务。这对需要快速部署机器人集群收集海量数据的企业，或预算有限的小型团队而言意义非凡！

基于相同原理，叠衣任务的优势在于可以精准固定摄像头位置。在学习新技能时，训练样本需要对接实际应用场景的环境空间实现"全面覆盖"。因此对环境控制力越强，学习过程就越高效——所需数据量更少，也更容易获得惊艳的演示效果。当您看到机器人在纯色桌面或极简背景下折叠衣物时，请记住这不仅是构图美观，更是为机器人提供了至关重要的操作便利！

由于我们需要收集海量数据——往往持续数十小时——才能完善任务执行，过程中难免出现失误。此时任务是否易于重置显得尤为重要，即能否快速恢复到可重新尝试的初始状态。叠衣服任务在这方面具有天然优势：若折叠过程中出现差错，只需拾起衣物轻轻一抖即可重置任务。这与整理橱柜玻璃杯的场景形成鲜明对比——倘若碰倒堆叠的杯子或失手摔碎，后果将十分棘手

叠衣任务还能有效避免与环境的强力接触。一旦涉及高强度压力，不仅可能导致物品损坏、任务状态无法重置，更因力量参数难以被策略准确捕捉，致使示范数据收集难度激增。而每个变量（如施加力量的强弱）最终都会要求更多数据支撑，以确保模型能覆盖所有预期操作情境。

未来可期

尽管如今叠衣演示层出不穷，但其中不少仍令我深感震撼。如前所述，Dyna的演示是我今年的最爱之一，这主要因为能持久运行的机器人策略至今仍属凤毛麟角。但该团队在旧金山Actuate大会与首尔机器人学习大会等多个场合成功展示了零样本折叠（即无需额外训练数据即可折叠），这确实令人惊叹——即便在当今机器人领域也实属突破性成果。

展望未来，我们有理由期待机器人能应对更具挑战性、更动态的环境交互：在执行操作任务时实现更快速移动、搬运重物，以及在崎岖地形攀爬或应对恶劣环境。

但就目前而言，我们需要认识到现代学习方法各有其优势与局限。虽然衣物折叠并非易事，但这类任务恰好与我们现有模型的能力高度契合。因此，未来我们必将见证更多此类应用的涌现。

产品名称

购买链接

智能佳机械臂 Mobile ALOHA 斯坦福机械臂完整复刻版复合机器人远程操控机械臂ROS开源学习实验平台 Mobile ALOHA 机械臂

https://item.jd.com/10100493559285.html

智能佳ALOHA2 完整套装斯坦福官方正统双臂协作深度学习与家政ROS开源科研平台具身智能实验设备 ALOHA 2 机械臂【开箱即用】

https://item.jd.com/10097978503518.html

您对此产品感兴趣，请联系我们！

智能佳机器人

400 099 1872

010-82488500/82488501