谷歌用人工智能教机器人如何抓东西和扔东西

蒋晨姬
导读 对物理定律有直觉理解的机器人可能听起来像艾萨克阿西莫夫小说中的东西,但谷歌机器人部门的科学家说,他们基本上创造了它们。他们认为,这

对物理定律有直觉理解的机器人可能听起来像艾萨克阿西莫夫小说中的东西,但谷歌机器人部门的科学家说,他们基本上创造了它们。他们认为,这样做可能会为未来可以学习投掷、滑动、旋转、摆动、捕捉和其他运动技能的系统奠定基础,这些技能目前对即使是最强大的机器也构成了挑战。

“尽管在让机器人有效地掌握物体、视觉上适应自己甚至从实践经验中学习方面已经取得了相当大的进展,但机器人操作仍然需要仔细考虑如何拾取、处理和放置各种物体——特别是在非结构化的设置中,”谷歌的学生研究员安迪曾(Andy Zeng)在博客中写道。“但机器人不仅能容忍动力学,还能学会有益地使用它们,发展物理学的‘直觉’,以便更有效地完成任务?”

为了回答这个问题,曾和他的同事们与普林斯顿大学、哥伦比亚大学和麻省理工学院的研究人员合作,开发了一种他们称为TossBot的拣货机器人,它学会了抓取并向其“自然范围”之外的盒子扔东西。它不仅是之前最先进型号的两倍,而且实现了两倍的有效投放范围,并可以通过自我监督进行改进。

投资于可预测性并不容易,即使对人类来说也是如此。握力、姿势、质量、空气阻力、摩擦力、空气动力学和无数其他变量都会影响一个物体的轨迹。通过反复实验来模拟射弹物理学是可能的,但曾梵志指出,这要花费大量时间,而且不会导致一个特别普遍的政策。

相反,TossingBot使用抛射体轨迹模型来估计将物体发送到目标位置所需的速度,并使用端到端的神经网络——以生物神经元为模型的数学函数层——来训练来自头顶的视觉和深度数据,以预测调整后的摄像机高于估计值。曾说,这种混合方法使系统的投掷精度达到85%。

教TossingBot捕捉物体有点棘手。首先,它尝试“糟糕的”抓取,直到它识别出更好的方式,同时,它通过偶尔随机投掷物体,以从未尝试过的速度提高投掷能力。经过大约14个小时的10000次抓取和投掷尝试,TossingBot可以在87%的时间里牢牢抓住凌乱堆中的物体。

也许更令人印象深刻的是,经过一两个小时的训练,TossingBot可以适应前所未有的地点和假水果、装饰物品和办公物品,并使用类似的、几何形状更简单的小工具。“TossingBot可能会学习更多地依赖几何线索(如形状)来学习抓握和投掷,”曾说。“这些新兴功能都是从零开始隐式学习的,除了任务级抓取和投掷,没有任何明确的监督。然而,它们似乎足以使系统能够区分对象类别(即乒乓球和记号笔)。”

研究人员承认,TossingBot没有用易碎的物体进行测试,它使用严格的视觉数据作为输入,这可能会妨碍它在测试过程中对新物体的反应能力。但他们表示,基本构想——将物理学与深度学习相结合——是未来工作的一个有希望的方向。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!