第一段:
具身智能作为当前科技领域的热点,其发展正从实验室研究逐步迈向实际应用阶段。然而,在这一过程中,行业面临着诸多关键问题亟待解决。例如,具身智能的核心技术瓶颈在哪里?中国在这一领域的机会和优势如何体现?“颠覆性时刻”何时能够到来?近期部分投资人的“批量退出”是否意味着行业正处于泡沫危机之中?这些问题成为了业内关注的焦点。
在最近举行的2025商汤技术交流日具身智能论坛上,由量子位总编辑李根主持,多位来自产学研界的专家共同探讨了这一话题。其中包括上海交通大学副教授闫维新、库帕思CEO黄海清、松应科技创始人聂凯旋、银河通用合伙人张直政以及商汤科技联合创始人杨帆。他们从产业链的角度出发,深入分析了具身智能与AI基础设施如何协同创新,从而突破行业困境,实现可持续发展。
第二段:
随着大模型技术的快速发展,具身智能取得了显著进步。小脑模型的进化使得机器人在不同地形和摩擦系数环境下的鲁棒性和泛化能力大幅增强;而大脑模型的创新则推动了具身智能在日常生活和工作场景中的广泛应用潜力。
张直政指出,具身智能领域呈现出科研、创新和应用全链条蓬勃发展的态势。数据积累呈现爆发式增长,大小脑模型及分层端到端模型等创新理念不断涌现。同时,国家政策的支持也让行业对具身智能的规模化商业应用充满信心。然而,尽管发展迅速,但具身智能仍处于技术探索阶段,面临数据互通难、成本高昂以及能力局限等诸多挑战。
黄海清提到,企业间的数据难以互通,导致训练效率受限;同时,高昂的成本也阻碍了机器人的普及速度。此外,机器人在主动思考和复杂环境适应能力方面与人类仍有较大差距,适用场景有限,需要行业共同努力解决。
第三段:
物理AI仿真在促进具身智能模型训练中扮演着重要角色。聂凯旋将其比喻为连接AI与物理世界的桥梁,让机器人可以快速学习各种技能,如抓取、行走甚至翻跟头、跳舞等。一套完善的物理AI仿真系统需要涵盖视觉、触觉、听觉和运动控制等多个组件,以实现机器人全方位感知物理世界的能力。
中国在数据采集方面具有明显优势,这被认为是实现“弯道超车”的关键。闫维新教授强调,中国在样本收集能力上远超国外,尤其是在机器人应用场景数据方面。这些丰富的数据资源为中国具身智能的发展提供了坚实基础。
第四段:
嘉宾们一致认为,在算法层面,中美差距不大,但在算力方面仍存在差距。张直政提出VLA将成为具身智能未来的核心技术路径,其高度泛化能力可大幅提升环境感知、任务规划推理和动作执行能力。商汤科技通过优化模型结构与硬件结合,努力缩小与国际领先水平的差距。
数据流通问题是行业发展的一大障碍。黄海清提出了四项举措来激活数据价值:制定语料数据标准规划、探索生产伴随式的数据采集方式、研发自动化标注工具链平台以及推进数据合成技术的应用。这些措施将有助于推动具身智能产业更好地服务于各行各业。
第五段:
具身智能的“打脸时刻”成为嘉宾们热议的话题。张直政认为,这种时刻将在各个行业中悄然降临,通过多层次、全方位的方式实现突破。闫维新教授以冬奥会期间的烹饪机器人项目为例,展示了机器人自主完成复杂任务的能力。黄海清则提出了两个标准:一是低成本完成简单重复性任务;二是具备共情能力,能在情感陪护等场景中给予人们关怀。
聂凯旋认为,每个子行业都有望诞生冠军企业,这些企业不仅代表技术领先,还能推动行业转型发展。杨帆期待的“打脸时刻”更为长远,他希望看到机器人在完成复杂任务的同时,能与外界进行无约束的交互。
第六段:
数据显示,今年具身智能领域的投融资活动频繁,热度持续攀升。然而,个别投资人对行业的公开质疑引发了关于“泡沫”的讨论。张直政认为,不同声音的出现说明人们对技术的想象力和边界产生了碰撞,这是科技创新的驱动力。闫维新教授表示,只要大方向正确,总能找到机器人能力上限和应用场景下限之间的交集。杨帆认为,只有直面质疑并克服它们,行业才能真正走向产业落地阶段。
尽管面临多重挑战,但嘉宾们的共识是,泡沫争议背后是产业突破的前奏。从烹饪机器人的自主操作到低成本工业场景的规模化落地,从情感交互的突破到跨行业效率的革命性提升,“打脸时刻”或许不会一蹴而就,却已在细分领域悄然酝酿。
本文来源: