首页 > 生活分享 > 免费教学 > 具身人工智能简史及其未来展望

具身人工智能简史及其未来展望

发布时间:2024-05-13 17:17:38

具身人工智能 (EAI) 将人工智能集成到机器人等物理实体中,赋予它们感知、学习和动态交互环境的能力。这篇文章简要回顾了EAI的历史,其当前发展,并讨论了其未来前景。

1. EAI的早期基础

1991年,Rodney Brooks在研究论文《没有表征的智能》[1]中首次广泛探讨了EAI的概念,该论文提出了一个激进的观点,即智能行为可以直接来自自主机器与其环境的简单物理交互,而不需要复杂的算法或内部表征。

1999年,罗尔夫·菲弗(Rolf Pfeifer)和克里斯蒂安·谢尔(Christian Scheier)撰写了《理解智能》(Understanding Intelligence)一文,认为智能并不局限于大脑或某些算法,而是智能体整个身体结构和功能的综合表现[2]。根据这种观点,作者反对传统的以大脑或计算为中心的智力理解,强调身体对智力形成的根本影响。

琳达·史密斯(Linda Smith)从认知科学出发,于2005年提出了“具身假说”,强调身体与环境的相互作用在认知过程中的核心作用[3]。根据具身假说,我们的思维、感知和能力是通过我们的身体和物理环境之间的持续相互作用而形成的。特别是,具身假说强调环境的基本作用,认为它不仅提供感官输入,而且还参与形成身体行为和认知结构。

这些基础研究强调了开发EAI系统的三个原则。首先,EAI 系统不能依赖预定义的复杂逻辑来管理特定场景。其次,EAI系统必须纳入进化学习机制,使其能够不断适应其操作环境。最后,环境不仅在塑造身体行为方面起着举足轻重的作用,而且在塑造认知结构方面也起着举足轻重的作用。

2. EAI的最新发展

大型语言模型(LLM)、视觉语言模型(VLM)等基础模型的最新进展,以及ChatGPT等技术在人形机器人中的应用[4],导致了一种普遍但不正确的信念,即EAI只是让这些基础模型在机器人中执行推理任务,以增强机器人的认知能力。

GPT-4、BERT、CLIP 和 DALL-E 等基础模型增强了机器人解释视觉和文本信息的能力,从而显著改善了它们的感知能力。这些模型允许机器人通过理解更类似于人类交互的上下文、对象和指令来执行复杂的任务[5]。此外,这些基础模型确实满足 EAI 系统设计的原则一,因此这些基础模型的推理不依赖于预定义的逻辑来管理特定场景。

但是,仅靠这些基础模型并不能概括 EAI 系统的全部要求。这些模型必须与进化学习框架集成,才能从它们与开放环境的物理交互中有效地学习。此外,我们需要开发一个虚拟环境来有效地与EAI系统进行交互,因为获取真实世界的交互数据非常昂贵且效率低下[6]。

原则二的一个示范是开发深度进化强化学习(DERL)框架[7],该框架允许探索和测试各种智能体形态以应对环境挑战,显著增强智能体的形态和行为适应性。此外,随着新形态的出现,新的数据也随之而来,以提高基础模型适应新环境的能力。因此,除了利用基础模型进行推理之外,建立有效的反馈循环也至关重要,该反馈循环有助于持续增强,使机器人能够动态地适应其操作环境。

有了扩展机器人认知能力的基础模型,以及适应新环境的进化学习框架,一个能够有效模拟现实世界并与EAI系统交互的虚拟环境是满足原则三的必要条件。最近的一个例子是 Habitat 平台 [8],它通过提供高效、逼真的 3D 模拟环境来训练虚拟机器人,从而促进了 EAI 的开发。Habitat 已在改进 EAI 系统方面得到证明,特别是在点目标导航等任务中,该平台提供大规模、可扩展的培训环境的能力可以显着提高传统方法的学习成果。

3. 未来展望

通过整合上述三个原则,我们可以构建一个功能齐全的EAI系统,能够动态适应不同的操作环境。自然而然的下一步是教机器人理解物理世界,例如重力的概念。我们相信,通过数据向机器人传授物理定律是机器人在我们日常生活中广泛采用的直接障碍。

尽管人工智能和机器人技术取得了重大进展,但目前的机器人系统仍然缺乏对物理世界的深刻、直观的理解。研究表明,虽然机器人可以执行某些任务或模仿人类行为的某些方面,但它们并不具有真正的类人理解[9]。这个问题可以通过生成与虚拟环境的精确物理交互数据来解决,并通过进化学习机制改进这些交互数据的基础模型。

已经探索了几种方法来向机器人传授物理定律。解决这个问题的一种方法是柏拉图,它被提议通过观看模拟视频来学习物理,这些视频描绘了物体根据物理定律相互作用[10]。该系统可以区分现实和荒谬的场景,例如物体消失或以不可能的方式执行。通过用视频训练PLATO对象遵循可预测的物理定律,人工智能学会了预测和理解基本的物理概念,从而增强了其对物理世界的一般推理。

第二种方法探索生成神经网络如何学习物理概念,并将这些学习轨迹与儿童的学习轨迹进行比较[11]。该研究评估了关于发育过程的两个假设:随机优化和复杂性增加。研究发现,虽然神经网络可以获得广泛的物理概念,但它们学习这些概念的顺序与在儿童中观察到的发展轨迹不一致。这种差异表明,尽管这些模型很复杂,但并不能完全捕捉到人类发展物理理解的微妙方式。

4. 结论

这篇文章追溯了 EAI 从其概念基础到现代应用和未来挑战的演变。特别是,我们强调了开发EAI系统的三个原则。首先,EAI 系统不得应用预定义的复杂逻辑来管理特定场景。其次,EAI系统需要结合进化的学习机制,以持续提供反馈。第三,交互数据生成需要与 EAI 系统交互的虚拟环境。最近的研究进展已经分别满足了这三个原则,但我们还没有看到一个包含所有三个原则的完全商业运作的系统。当这样的系统准备就绪时,一个迫在眉睫的挑战是教EAI系统理解物理定律,以便它们在物理世界中顺利运行。

免费教学更多>>

安道拓发布模块化座椅解决方案ModuTec 停产多年后启动大规模招聘,“山寨车鼻祖”众泰汽车艰难求生 中国品牌二手车销量跃升南非市场前列,Tiggo 4 Pro成最畅销车型 未来院孵化企业完成数亿元Pre-A轮融资 不敢在印度建厂造车,真是因为带不回利润? 行业首个!128TOPS单芯片跑通城市NOA,轻舟智航联手理想汽车,首发量产上车 吉利集团发布2030战略,剑指650万辆! 央企新能源转型生死局, Meta今年拟实现AI眼镜年产能翻番 剑指2000万副 抵挡敌意收购,Netflix考虑修改条款全现金收购华纳兄弟 美国科罗拉多州警车引入自动车辆识别系统 号称每小时可开出12张超速罚单 苹果为何选择与谷歌AI合作?郭明錤:迫于短期挑战、压力 苹果和谷歌谈成一笔大生意,马斯克发文:强烈不满! 本田启用新Logo,明年将率先搭载于新款纯电车和混动车 日本车企在中国销量连跌7年,该怎么稳定汽车市场呢 王自如回应不看格力工资条 还有下半句:基层员工一定要看 美系巨头们的“去中国化”豪掷,能赢吗? 8.88万元起售/智能AI加码,上汽大众朗逸 Pro上市 限时焕新价12.49万起 2026款捷途旅行者上市 小鹏汽车Q3毛利率首破20%,Q4交付目标上调至12.5万辆 已签约!安波福新项目落地武汉 Flyme Auto合作车型10月销量超19.5万辆,同比增长200% 3M动力电池解决方案——助力推动电动出行的未来 为Linux开发者而来!同星智能发布多款SocketCAN工具 三星有望重启 Galaxy A7x 系列,新机 Galaxy A77 在 Geekbench 跑分平台现身 优酷、B站,被一个后来者超车了 毫无预兆的,Gartner给大模型开发平台排了座次 USB接口的颜色可以说是快速识别性能的“视觉语言”,但并不是标准和推荐的方法 18个月月收33万刀!起底“AI套壳”生意经:是昙花一现还是隐形金矿? 你的快递,是无人车送的,物流公司为了降低亏损、补充人力