理解对象关系的人工智能

娄融羽
导读 许多深度学习模型很难以这种方式看待世界,因为它们不了解单个对象之间的纠缠关系。如果不了解这些关系,设计用于帮助厨房中的人的机器人将...

许多深度学习模型很难以这种方式看待世界,因为它们不了解单个对象之间的纠缠关系。如果不了解这些关系,设计用于帮助厨房中的人的机器人将难以遵循“拿起炉子左侧的抹刀并将其放在砧板顶部”这样的命令。

为了解决这个问题,麻省理工学院的研究人员开发了一种模型,可以理解场景中对象之间的潜在关系。他们的模型一次表示一种个体关系,然后结合这些表示来描述整个场景。这使模型能够从文本描述中生成更准确的图像,即使场景包含多个以不同关系排列的对象也是如此。

这项工作可应用于工业机器人必须执行复杂的多步骤操作任务的情况,例如在仓库中堆叠物品或组装电器。它还使该领域更接近于使机器能够像人类一样从环境中学习并与之交互。

“当我看一张桌子时,我不能说 XYZ 位置有一个物体。我们的大脑不是那样工作的。在我们的脑海中,当我们理解一个场景时,我们真正理解它是基于它们之间的关系计算机科学与人工智能实验室 (CSAIL) 的博士生 Yilun Du 说:“我们认为通过构建一个可以理解对象之间关系的系统,我们可以使用该系统更有效地操纵和改变我们的环境。” ) 和论文的共同主要作者。

标签: 理解对象关系的人工智能

免责声明:本文由用户上传,如有侵权请联系删除!