OpenAI的研究人员调整了由他们的AI系统Dactyl控制的机械手

手机 来源:网易 2022-02-17 03:54   阅读量:17910   

AI正在教机器人更优雅的动作,但它们的学习能力仍然无法与人类匹敌

这个世界上没有任何东西——动物或机器人——能与人手的灵活性和灵巧性相提并论对于 Elon Musk 创立的非营利组织 OpenAI 的工程师来说,这既是挑战也是机遇他们的研究人员如何使用人工智能来教机器人像人类一样巧妙地操纵物体

通常,在教人工智能控制物理机器人时,科学家们往往会遇到同样的问题训练通常使用强化学习来完成,一种人工智能通过反复试验的过程来学习的方法但这需要很多时间,通常相当于多年的经验如果你想让 AI 击败电子游戏,那很好——你只需让它以更快的速度玩游戏但是如果你想教它一个现实生活中的任务,你就有麻烦了您不能等待机器人手臂在多年的实践中蒙混过关,而且很难获得对训练目的足够准确的世界模拟

对于 OpenAI,他们为自己设定的任务是教机器人手操作六面立方体,将它从一个位置移动到另一个位置,因此特定的一面朝上与早期的研究一样,他们从尽可能准确地模拟这个环境开始,但他们的下一步是有所作为:他们开始弄乱模拟

首先,他们添加了随机的视觉噪音然后,他们改变了虚拟手和立方体的颜色他们随机化了立方体的大小,它的表面有多滑,以及它有多重他们甚至弄乱了模拟的重力所有这些的效果是让 AI 更好地理解在现实世界中操纵立方体可能会是什么样子虽然模拟可能并不完全真实,但它有足够的变化,让系统能够学会处理意外情况

学分:OpenAI

OpenAI 的研究人员调整了由他们的 AI 系统 Dactyl 控制的机械手。

参与该项目的 OpenAI 的 Matthias Plappert 解释说,改变模拟的重力是一个特别有趣的技巧该团队知道,当被称为 Dactyl 的 AI 系统控制真正的机器人手时,手的底部可能不会每次都以相同的角度定位较低的角度意味着立方体会更容易从手中掉落为了教 Dactyl 如何处理这种变体,他们决定在模拟中随机化重力角如果没有这种随机化,它会一直丢弃物体,因为它不习惯,普拉珀特说

不过,完成所有这些随机化需要很长时间很长一段时间事实上,Dactyl 必须积累大约 100 年的经验才能达到最佳性能反过来,这意味着团队必须使用大量计算能力——大约 6,144 个 CPU 和 8 个功能强大的 Nvidia V100 GPU只有极少数研究机构可以使用这种硬件

但最终结果是值得的,普拉珀特说完全训练后,Dactyl 能够连续将立方体从一个位置移动到另一个位置多达 50 次而不会掉落在学习移动它手中的立方体时,Dactyl 甚至发展出了类似人类的行为所有这些都是在没有任何人工指导的情况下学会的——只是反复试验,一次几十年

这表明我们人类为操纵所做的事情是非常优化的,普拉珀特说这是一个非常有趣的时刻,当你看到一个机器人试图解决一个问题时,你会想‘哦,嘿,我也会这样做

学分:OpenAI

OpenAI 系统学到的一些类人特征。GSM8K数据集由8.5K道优质小学数学应用题组成,每道题需要2到8步才能解决,涉及加减乘除的综合运算,已近9-12岁。。

机器人和人工智能领域的专家在接受The Verge采访时称赞了 OpenAI 的工作,但警告说它并不代表机器人操作的突破卡内基梅隆大学机器人研究所的 Smruti Amarjyoti 指出,随机化系统训练环境的想法以前已经完成,但他表示 Dactyl 的动作是优雅的,他认为这对 AI 来说是不可能的

最终的结果非常复杂和精致,Amarjyoti 说我认为 OpenAI 在这一领域的最大成就将是它所采取的工程协调以及用于实现这一壮举的计算能力

专家说 OPENAI 的结果很优雅,但从根本上来说是有限的

Istituto Italiano di Tecnologia 的机器人学教授 Antonio Bicchi 表示,这项研究优雅而热情,但也指出了一些局限性结果仍然仅限于在相当有利的条件下的特定任务,甚至还不能成为一个结论性的论据,即这些技术可以解决现实世界的机器人问题,Bicchi 说

对于 OpenAI 来说,这项研究之所以令人满意,是因为 Dactyl 的骰子杂耍之外的原因该系统使用了实验室开发的许多相同的算法和技术来训练其视频游戏机器人OpenAI Five该公司表示,这表明它正在构建可用于解决各种任务的通用算法——对于雄心勃勃的人工智能实验室和公司来说,这是一个圣杯

在人工智能的帮助下创造更灵巧的机器人对于试图自动化体力劳动的公司来说将是一个巨大的福音,并且有许多初创公司积极从事这一领域的研究但是,虽然提高机器人技术的最新水平肯定会让更多的工作实现自动化,但新技术创造的工作是否可以抵消这种工作破坏浪潮是一个悬而未决的问题

无论哪种方式,很明显,人工智能在达到人类运动技能之前还有很长的路要走Bicchi 指出,Dactyl 花了将近一百年的时间学习的能力,只需很少的试验, 有了新的对象和任务,就可以被人类掌握但可以肯定的是,机器正在迎头赶上,速度比以往任何时候都快

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

友情合作