李飞飞团队发布“具身智能”成果:机器人接入大模型直接听懂人话
日期:2023-07-12 11:44:51 / 人气:276
李菲菲发布了“身体智能”的结果:当连接到一个大型模型时,机器人可以直接理解人的话。近日,斯坦福大学李菲菲团队发布了“身体智能”的最新成果:VoxPoser,即将一个大型模型连接到一个机器人上,将复杂的指令转化为具体的行动计划,使人类可以随意用自然语言向机器人发出指令,机器人不需要额外的数据和训练。
据悉,与需要额外预训练的传统方法相比,这种方法使用一个大模型来指导机器人如何与环境进行交互,因此直接解决了机器人训练数据稀缺的问题。
值得一提的是,这种方法利用视觉语言模型对真实场景中的目标进行感知和分析,比如绕过障碍物,甚至完成开瓶、按下开关、拔掉充电线等复杂操作,无需训练。
去年5月,李菲菲在美国艺术与科学学院杂志Ddalus上发表了一篇文章。他以计算机视觉中的物体识别任务为切入点,研究了ImageNet数据集的开发和相关算法。其中,她提出了计算机视觉发展的三个方向:具身AI、视觉推理和场景理解。
身体智能,从字面上看,就是有“身体”的智能体,顾名思义,是软硬件结合的智能体,即人工智能机器人。同时,由于大模型的盛行,人们普遍将其视为人形机器人与大模型的结合。
对此,李菲菲认为,具身智能不仅仅指人形机器人,任何可以在空间移动的有形智能机器都是人工智能的一种形式。
除了李菲菲,英伟达的创始人黄仁勋、特斯拉的首席执行官马斯克和其他大牌都非常看好智能化的前景。
目前,我国各类机器人发展迅速。在上周的世界人工智能大会上,包括特斯拉擎天柱在内的20多个机器人亮相。与此同时,国内相关算法、大模型、芯片、零部件等产业链相关企业也在机器人领域进行了布局,为体现智能这一新兴概念奠定了基础。
随着ChatGPT流量的下降,人们期待着下一个现象级应用的诞生。借助机器人与大模型的结合等相关技术,未来的具身智能将进入人类生活,真正把人类从繁重的工作中解放出来,势必会掀起新一轮的创新浪潮。"
据悉,与需要额外预训练的传统方法相比,这种方法使用一个大模型来指导机器人如何与环境进行交互,因此直接解决了机器人训练数据稀缺的问题。
值得一提的是,这种方法利用视觉语言模型对真实场景中的目标进行感知和分析,比如绕过障碍物,甚至完成开瓶、按下开关、拔掉充电线等复杂操作,无需训练。
去年5月,李菲菲在美国艺术与科学学院杂志Ddalus上发表了一篇文章。他以计算机视觉中的物体识别任务为切入点,研究了ImageNet数据集的开发和相关算法。其中,她提出了计算机视觉发展的三个方向:具身AI、视觉推理和场景理解。
身体智能,从字面上看,就是有“身体”的智能体,顾名思义,是软硬件结合的智能体,即人工智能机器人。同时,由于大模型的盛行,人们普遍将其视为人形机器人与大模型的结合。
对此,李菲菲认为,具身智能不仅仅指人形机器人,任何可以在空间移动的有形智能机器都是人工智能的一种形式。
除了李菲菲,英伟达的创始人黄仁勋、特斯拉的首席执行官马斯克和其他大牌都非常看好智能化的前景。
目前,我国各类机器人发展迅速。在上周的世界人工智能大会上,包括特斯拉擎天柱在内的20多个机器人亮相。与此同时,国内相关算法、大模型、芯片、零部件等产业链相关企业也在机器人领域进行了布局,为体现智能这一新兴概念奠定了基础。
随着ChatGPT流量的下降,人们期待着下一个现象级应用的诞生。借助机器人与大模型的结合等相关技术,未来的具身智能将进入人类生活,真正把人类从繁重的工作中解放出来,势必会掀起新一轮的创新浪潮。"
作者:焦点注册登录平台
新闻资讯 News
- 通过放短视频来堆音量,这次被短...12-04
- 计算能力租赁价格暴涨,玩家涌入...12-04
- 三星CIS涨价30%,国内CIS厂...12-04
- 业带商,命运掌握在自己手里12-04