### 30天速成上岗:Figure人形机器人运用视觉控制和数据优化技术,高效完成快递分拣与运动模式下的零样本处理扁平包裹

人形机器人在物流工厂的应用突破:Figure AI的最新进展

近日,Figure AI发布了一段视频,展示了其最新的VLM模型已成功应用于Figure 02人形机器人,并部署于物流工厂进行快递分拣工作。整个部署过程仅耗时30天,相比之前在宝马工厂负责汽车装配的12个月准备时间,效率显著提升。

在视频中,一排机器人能够较为流畅地抓取和摆放快递,尽管速度仍略逊于人类操作员。通过头部摄像头,机器人可以识别快递上的条码,并能自我校正漏拣的情况。这些改进得益于Figure研发团队对Helix系统1(S1)低级视觉运动控制策略的一系列优化:

1. 视觉表征优化
新版系统引入了立体视觉主干网络结合多尺度特征提取网络,构建了更丰富的空间层次表征。这不仅提升了视觉控制的可靠性,还使系统能够在处理不同尺寸包裹时表现得更加鲁棒。与之前的单目视觉输入相比,新系统通过双摄像头信息融合,在不增加计算资源的情况下提高了视觉标记的准确性。

2. 跨机器人迁移
Figure开发了一种视觉本体感受模型,通过机载视觉输入估计末端执行器的六维姿态,实现了高效的“自我校准”。这一功能使得同一策略可以在多台机器人之间快速迁移,即使硬件存在细微差异,也能保持一致的操作性能,大大减少了重新校准的需求。

3. 数据优化
研发团队筛选了高质量的人类示范数据,剔除了低效或失败的案例,同时保留了自然修正动作。这种做法不仅提高了数据质量,还显著提升了系统的吞吐量,即便训练数据量减少了三分之一,吞吐量依然提高了40%。

4. 推理时操作加速
通过插值技术(称为“运动模式”),系统能够在测试阶段实现20%到50%的速度提升。特别是在提速50%的情况下,系统的表现尤为出色,有效吞吐量甚至超过了演示数据。然而,当提速超过50%,由于动作不精确,系统需要频繁重置,导致吞吐量下降。

Figure还宣布了Helix团队的扩充计划,正在招募大模型训练、操控工程师、大模型评估和强化学习等岗位的人才。虽然目前人形机器人在快递分拣中的效率尚未超越人工或机械臂,但其强大的场景适应性和跨设备迁移能力为未来的大规模应用奠定了基础。随着部署时间从12个月缩短至1个月,甚至未来可能缩短到几天,人形机器人的商业化前景愈发广阔。

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...