2025年的蛇年春晚上,一群来自杭州某具身智能创业公司的机器人带来了一场别开生面的扭秧歌表演,吸引了全球观众的目光。在张艺谋导演的《秧BOT》节目中,这些机器人身着东北特色的花棉袄,随着音乐翩翩起舞,动作精准流畅,手中的手绢转得虎虎生风,与人类舞者相比也毫不逊色。这场表演不仅展示了中国具身智能机器人技术的飞速发展,更引发了人们对这一领域的广泛关注与深入思考。
具身智能机器人的技术挑战与前景
具身智能机器人是人工智能与物理世界深度融合的结晶,正逐步成为未来科技发展的关键方向。清华大学全球创新学院院长、自动化系教授刘云浩在其新书《具身智能:人工智能的下一个浪潮》中,以通俗易懂的方式剖析了什么是具身智能,以及如何实现从人工智能到具身智能的跨越。要使机器人能够像生物一样“自然地做到”跑步、跳跃等动作,需要解决感知环境、运动规划和精确执行三大难题。波士顿动力公司花了数十年的时间才使其机器人能在实验室条件下实现类似动物的动作,这显示了具身智能的巨大挑战。
日常任务中的复杂性与恐怖谷效应
日常生活中的简单任务如切菜、刮胡子、整理收纳等,对机器人来说涉及复杂的运动控制和精细的感知能力。例如,切菜不仅需要根据食物的硬度、形状和纹理调整力度和切割角度,还需要避免切到手;刮胡子则要求机器人能精准识别脸部轮廓,轻柔而有效地去除毛发。这些任务对机器人来说非常困难,稍有不慎还可能掉入所谓的“恐怖谷”,即当机器人接近但尚未达到与真实人类无法区分的程度时,引起的不适感或恐惧。
具身智能的核心要素与未来发展
具身智能由“具身”和“智能”两个词组成。动物尤其是人类能够做到运动控制,依赖于神经系统、肌肉系统以及感觉系统的协同工作。对于智能机器,我们希望其行动能够做到准确、迅捷、协调。然而,要让机器变得如此灵巧并非易事。从维纳的控制论开始,行为主义在这个领域做了大量工作。尽管现代智能机器已经能够在特定环境中展现出卓越的成就,但在面对复杂多变的现实世界时,仍然存在重大瓶颈。
提升智能机器的交互能力
提升智能机器的交互能力,除了改进控制算法和执行器的物理性能外,还需要聚焦于“知”的深度与广度,即对行动主体与客体的全面理解。例如,OpenAI在2019年发布了一个用机械手解魔方的系统,展示了卓越的鲁棒性和感知能力。此外,通过多种传感器的融合,智能机器可以在不受传统感官局限的情况下,探索一个更广阔的感知世界。
智能化熵增与具身导航
互联网和物联网时代的连接不仅传递认知,还创造了新的认知方式。连接赋予了智能机器更多感知和认知的能力,使得它们能够更好地适应复杂环境。智能化熵增现象表明,智能不再局限于单个设备,而是遍布世界的每个角落。例如,车联网使得无人驾驶汽车能够通过信息共享,实现更高效的安全驾驶。未来,道路及车辆的集合将被视为一个具身智能体,进行全局交通调控,进一步提高交通安全和效率。
