在素有“欧洲心脏”之称的维也纳,具身智能正经历一场底层范式转移——“ICRA 2026的VLA时刻”已经从一种技术预测变成了全面铺开的现实。

6月5日,机器人与自动化领域顶会ICRA 2026在维也纳正式落幕,在本届 ICRA 的核心工业展区,放眼望去皆是中国展商的身影,包括智元机器人、速腾聚创、宇树科技、千寻智能、帕西尼等中国具身智能企业纷纷亮相。
定标准、建生态
抢占具身智能评测标准话语权
如果说去年的关键词还是“大模型”,那么今年ICRA的核心叙事已明确转向“物理AI”。在这场从感知到行动的范式转移中,中国企业正在以前所未有的力度改写全球机器人产业版图。
由智元主办的AGIBOT WORLD CHALLENGE 2026在此次会上收官。本届赛事吸引全球 27 个国家及地区、526 支顶尖科研与产业战队参赛,依托Reasoning to Action 推理 - 操作、World Model世界模型以及 WBC全身控制三大技术赛道、线上标准化评测 + 线下真机闭环验证模式,搭配全链路开源数据、仿真平台与机器人硬件底座,成为 ICRA 官方体系下技术壁垒最高、评测体系最完整、学术与产业结合最紧密的具身智能国际赛事之一。
本届赛事设立Reasoning to Action(推理 — 操作)、World Model(世界模型)以及WBC(全身控制)三赛道体系,分别锚定具身智能 “任务理解→行动决策” “物理世界预测→交互建模” 与“云端推理→全身控制”三大核心能力,构建覆盖全技术链路的竞技与评测体系,引导机器人从被动执行走向主动理解、预测与决策。
参赛阵容囊括中国科学院、清华大学、中国科学技术大学、加州大学圣迭戈分校等海内外知名院校,以及小米、Sber Robotics Center、阿里巴巴、高德、vivo等头部产业研发团队,超百支队伍突破官方基准考核线,整体竞技水准创下历届新高。
过去几年,具身智能领域一直被“刷分打榜”现象困扰。各家机构用各自的仿真平台、各自的任务设计、各自的评分口径,谁的算法更强,外人几乎无从比较。而现在,是骡子是马,拉出来遛遛。ICRA现场的展示不再满足于让机器人平地上走两步,或者唱歌跳舞,而是被拉到了更加逼真的动态干扰环境中进行“抗压测试”。

智元机器人引入了行业首个真实商超场景的全链路决策评测赛道(WBC)。赛道将考场搬进高度还原的真实商超环境,模型需直面货架层高限制、物品随机摆放等不可控物理复杂性,完成从自主导航、精细化取货到行走放置的完整移动操作全序列,告别单一抓取Demo。全程采用API远程直连模式,选手代码直接驱动真实物理机器人完成实测,为具身智能全身控制能力提供了真实落地标尺。最终,来自小米机器人的周熊队以99.2的综合得分和94%的整体任务成功率获得冠军,GRNVLA和PrismBot分获二三名。
从解决长期困扰行业的评测口径不一、横向对比困难、仿真与真机表现脱节等痛点,线下总决赛统一采用精灵G2人形机器人开展实景比拼,摒弃行业“唯仿真分数论”,把真机运行稳定性、物理环境适配度、长周期任务可靠性设为核心评分依据,倒逼技术研发锚定真实应用需求。
一流的企业做标准。从这场比赛来看,智元机器人正在争抢具身智能评测标准的话语权。
千寻智能则展示了自研的具身基座模型 Spirit v1.6,以精细力控与泛化执行能力演示了整理书桌、串糖葫芦等场景。

在不久前举办的行业盲测中,千寻智能力压英伟达最新模型 Cosmos3 与 Physical Intelligence(PI)的 Pi0.5,霸榜全球第一,成为第一梯队中颇为耀眼的“中国大脑”。
更灵敏、更集成
高性能传感硬件成通用标配
当下具身智能面临的核心困境在于:真实物理交互数据极度稀缺,尤其是人类手部精细操作的触觉信息,几乎无法被高精度、可规模化地采集与复刻——这直接制约了机器人的泛化能力与落地进程。
直面这一痛点,帕西尼携五指数据采集手套PXCap Ⅴ亮相。它以高精度触觉感知硬件为核心,实现全手无盲区触觉覆盖、超高物理一致性等突破,能够复刻人类手部精细操作,为多场景、长任务提供真实数据采集能力。

过去,高精度触觉传感器因造价昂贵、工艺复杂,长期被视为实验室的“奢侈品”。而以帕西尼为代表的自研霍尔触觉核心技术,打破海外技术垄断与定价壁垒,大幅降低高端感知科研准入门槛,让高性能传感硬件挣脱成本桎梏,跻身具身智能领域通用标配。
值得一提的是,本届大会还出现了来自中国的官方合作伙伴——深圳速腾聚创(RoboSense)公司。面向机器人进入千行百业的量产时代,速腾聚创展示新一代空间感知技术,向全球顶尖学者与产业领袖展示了其在机器人融合传感器路线上的最新突破。
速腾聚创展示的新一代基于多模态数据融合空间智能感知系统技术,直指当前机器人视觉感知领域长期存在的精度与鲁棒性瓶颈。
速腾聚创副总裁杨先声表示,在ICRA 2026这一国际舞台上,速腾聚创与全球研究者共同探讨空间智能与机器人感知的进化方向。面向“Robots for all”的机器人量产时代,感知基础设施不能仅停留在“看得见”,更要实现“看得准、看得稳、看得全”。

从底层模型霸榜到开源硬件普惠,中国力量正在以全链条的姿态,在维也纳的舞台上重新定义全球具身智能的竞赛规则。
南方+记者 郜小平
订阅后可查看全文(剩余80%)