新浦京www81707con有了这项新技术机器人可就真的成精啦,能自己拿起从未见过的物品

新浦京www81707con有了这项新技术机器人可就真的成精啦,能自己拿起从未见过的物品。原标题:有了这项新技术机器人可就真的成精啦!

原标题:瞄准工业智能化市场,麻省理工让 AI 教机器人操纵物品

新浦京www81707con 1

麻省理工学院的计算机科学与人工智能实验室开发了一种新系统,使机器人能够拾取和处理任何物体,甚至是他们以前从未见过的物体。尽管智能机器已经变得如此,但大多数工厂机器人仍然需要预先设定他们将要处理的物体

这就是为什么机器人专家自己开发技术可以教会自己如何操纵各种物品。CSAIL的系统称为kPAM,它通过将对象视为3D关键点的集合来创建对象的可视路线图。

新浦京www81707con 2

麻省理工学院

CSAIL表示,kPAM或Keypoint Affordance
Manipulation比其他类似技术更准确。在检测到对象上的所有坐标后,它会确定它可以用它做什么。例如,如果它看到一个带把手的杯子,它可以把它挂在钩子上。如果它确定它正在看一双鞋子,它可以将鞋子放在架子上。“仅仅了解一下这个对象

  • 一些关键点的位置 –
    足以支持各种有用的操作任务。这种特殊的表现形式与当今最先进的机器学习完美结合感知和规划算法,“该研究的资深作者,麻省理工学院教授拉斯泰德拉克说。

研究人员希望进一步开发该系统,直到由kPAM驱动的机器可以完成更大的任务,例如卸下洗碗机和擦拭厨房。他们还希望系统可以在未来为更大的操纵机器的工厂机器人提供动力。

来自engadget的消息称,麻省理工学院最新研究发布的的机器视觉系统可以让机器人自行解决它所看到的问题。

人工智能正在一步步走向强大。今天,麻省理工学院又公布了一项新发明,让科技更进一步。

拾取机器人指的是一种能够拾取和放置不同东西的机械臂,这种机器人能够执行自己已经熟悉或输入命令的重复性操作,但过于复杂的过程和不熟悉物体的拾取,对这种机器人来说是一种非常具有难度的挑战。其实这并不奇怪,这些机器人不仅要对物体定位并理解如何抓住它们,而且这还需要大量的训练数据,同时还抓取之后还要将物品放下来,这样就不会对周围环境造成破坏或干扰。

对于反复执行特定动作的机器来说,目前的计算机视觉技术已经足够了,比如从装配线上取下一个物体,把它放到一个箱子里。然而,要让机器人变得足够有用,不仅能在仓库里装箱子,还能在我们自己的家里帮上忙,目前的而技术就显得力不从心了。

麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员,发明了一种名为
DON
的“密集的视觉对象网”——让机器人能学会独立观察、理解并操作它们从未见过的物体。

不过,最近来自麻省理工学院计算机科学与人工智能实验室的科研人员来找到了一种克服这些障碍的新方法。在一份最新发布的研究报告中,研究人员描述了一种新的系统,这种系统可以通过一种缩写为“kPAM”的关键点操作方式,可以检测目标坐标的集合并将其定位要点,使机器人的硬件配合软件系统来处理目标和对象。

对此,麻省理工学院设计了“DON”系统。

研究人员们计划今年10月在瑞士的机器学习大会上展示他们的新发明。

新浦京www81707con 3

DON,或称“密集物体网”,是麻省理工学院计算机科学和人工智能实验室(CSAIL)开发的一种新型机器视觉形式。它能够生成一个“可视化路线图”——即以坐标形式排列的可视化数据点的集合。这个系统会把这些单独的坐标集拼接成一个更大的坐标集合,就像您的手机可以将多张照片拼接成一个全景图像一样。这使得系统能够更好、更直观地理解对象的形状以及它在周围环境中的工作方式。

新浦京www81707con 4

麻省理工学院教授、资深作家拉斯·特德雷克在一份声明中说:“当你在YouTube上看到关于机器人的视频时,你其实应该仔细看看它做不到什么。虽然这些机器人几乎可以拿起任何东西,但如果是一种它们从未见过的物体,显然就算拿起来之后,机器人也不知道应该如何将这些东西放下。”

“从计算机视觉系统中得到的最粗糙、最高级的东西就是检测目标,”该研究论文的作者、博士生Lucas
Manuelli告诉Engadget。“下一步是进行像素标记,所有的像素都是一个人或一条道路的一部分。很多自我驾驶汽车系统都会进行这两部操作。“

DON试图抓起一只鞋子(图片来源:MIT CSAIL)

新浦京www81707con 5

“但如果你真的想以某种特定的方式与某个物体互动,比如以特定的方式抓住鞋子或抓住一个杯子,”他继续说道,“那么仅仅有一个边界框或所有对应于杯子的像素是不够的。我们的系统必须得在对象中获得更精细的细节……这种信息对于进行更高级的操作任务是必要的。“

核心研究人员 Lucas Manuelli
说:“目前的许多科技手法都无法识别物体的准确样貌。例如,现有的算法无法操纵机器手柄来抓一个杯子。尤其是当杯子的形状和摆放复杂时,更为艰难。”

通常来说,大多数的拾取与定位感知以及抓取算法的估计都是通过位置、方向和几何形状确定而不是点,这对于涉及到形状奇怪目标的抓取任务来说很难理解。相反,kPAM系统绘制的3D关键点管道可以“非常自然的”适应对象类型之间的变化。研究人员表示,只需要三个坐标就能确定一个相对统一的目标,比如一个咖啡杯(更重要的是一个在底部中心和顶部中心),就可以确定咖啡杯的位置和放置方法。

也就是说,DON系统可以让机器人看着一杯咖啡时,正确定位到咖啡杯的手柄上。当机器人拿起咖啡杯时,DON系统能让机器人意识到杯子的底部需要保持指向下方,以避免杯子里的东西洒出来。

DON
不是一个控制系统。相反,它是一种自我监督的深层神经网络——一种模仿大脑神经元功能的分层算法——训练机器人用精确坐标的形式来描述物体。在训练结束后,DON
能够自主地挑选出参考框架。当一个类似的新物体出现时,DON
就可以将它们映射到一起,在三维空间中计算出物体的可视化形状。

Tedrake表示:“只要对物体有一点点了解,通过几个关键点的位置就足以实现各种有用的操作任务。”

新浦京www81707con 6

新浦京www81707con 7

新浦京www81707con 8

更重要的是,该系统将允许机器人从一堆相似的物体中挑选出特定的物体。

DON的视角(图片来源:MIT CSAIL)

研究人员利用目前最先进的积分人工智能模型进行关键点检测,该模型以单个RGB和深度图像作为输入,并为每个坐标输出一个概率热图和深度预测图。后续过程还将恢复2D图像坐标、深度值和最终的3D关键点)。研究人员通过将关键点投射到图像空间中来收集包含感兴趣对象场景的训练数据,并根据3D重建算法估计出摄像头的姿态。

“许多操纵方法无法让机器人在不同的方向上识别出物体的特定部分,”Manuelli在研究中写道,“例如,现有的算法无法通过手柄抓住马克杯,特别是当马克杯朝着不同的方向时。”

新浦京www81707con,根据研究人员所说,不论是硬的物体(如帽子)还是软的物体(如毛绒玩具),DON
都只需要20分钟就可以完成学习。DON
可以识别各种各样的物品,包括适度变形的物品以及质感非常轻薄的物品。

在实验中使用到的库卡IIWA LBR机器人被安装了一套名叫Schunk WSG
50系统中,从而实现了完整的训练系统,这套系统可以成功的引导机器手臂把鞋子放在鞋架上或者将被子顺利挂载杯架上。

该系统依赖于拥有RGB深度相机组合的RGB-D传感器。并且,这个系统可以进行自我训练——如果你想让系统识别棕色的靴子,你只需把机器人放在一个有棕色靴子的房间里,然后这个系统将自动循环启动,获取用于生成坐标点的参考照片,然后根据所看到的内容进行自我训练。整个过程不到一个小时。

此外,DON 并不会分辨物体的颜色和纹理,这使得它在使用 RGB
或深度数据上更有优势。因为只要一点轻微变形,颜色和纹理就会改变,不具备“可抓取”的特性。

机器人对使用20双鞋的测试过程没有出现任何问题。在100次试验中,只有两次没有把鞋放在鞋架上。当机械臂不小心抓住鞋跟时,就会发生错误,导致鞋子从原来的位置移动。

新浦京www81707con 9

“在工厂里,机器人通常需要十分复杂的部件才可以工作,”Manuelli 说,“但是像
DON
这样的系统就能省去这些复杂部件。只需拍一张照片,就能掌握和操纵物体。”

在第二个“杯子架”测试任务中,机器人对40个形状、大小和外观设计都不相同的水杯进行了一系列测试,当杯子垂直放置时,它能够抓住所有杯子,但由于触手的开口有限,水杯水平放置时只能抓住其中的19个杯子。令人印象深刻的是,除了两次试验,它把杯子放在距离目标位置不到5厘米的架子上。

“在工厂中,机器人通常需要复杂的零件才能可靠地工作,”Manuelli写道,“但像这样一个能够理解物体方向的系统,只需拍张照片,就能相应地把握和调整物体。”

新浦京www81707con 10

由于有的测试杯子的手柄比较小,只有30个杯子,其中5个杯子的手柄高度和宽度都不到两厘米。握杯器可以百分之百的将大杯子挂在架子上,但是对于小尺寸的杯子,它的成功率只有百分之五十。研究人员将失败案例的原因归咎于不准确的关键点检测失误。

这项技术仍然处于起步阶段,Manuelli希望在不断完善后,能够应用到家庭的日常机器中,帮助人们更好地生活。

DON正在抓取一只杯子(图片来源:Tom Buehler / MIT CSAIL)

在测试中的其他领域也有改进的空间。Tedrake指出,人类必须对其系统所需的训练数据进行注释,他们打算在未来的工作中逐步淘汰这一过程,用合成数据补充真实世界的样本。研究人员也承认,即使对象类别没有更大程度的改变,关键点也必须被重新标记,模型也必须进行重新训练。

【更多人工智能资讯欢迎关注微信公众号“AI锐见”(Rebuild_ai)】返回搜狐,查看更多

团队认为 DON
可以应用在工业环境中,例如用作仓库机器人。同时,团队希望开发一个更有能力的版本,让机器人可以对物体进行“更深入的理解”。

尽管如此,研究人员仍然坚持认为,与目前的大多数方法相比,这套系统提供了比以往更大的灵活性,而且他们相信未来终有一天,这套系统可能会帮助机器人完成一些更复杂、更具有灵活性的任务,比如从洗碗机里将碗取出、清理厨房太面以及在工厂和其他工业环境中进行各种复杂和不确定的取放作业。

责任编辑:

研究人员写道:“我们认为,DON
是一种新颖的物体表现形式,可以衍生出使许多全新的机器人操作方法。”

在这个领域,国内也有很多公司在做类似的事,例如梅卡曼德、阿丘、库柏特等等。这些公司都在瞄准工业智能化市场,为工业机器人赋予视觉与触觉双重感知能力。返回搜狐,查看更多

责任编辑:

相关文章