
最近配资在线机构论坛网,全球网民通过直播见证了Figure AI的人形机器人在物流传送带上连续工作几十个小时,不间断地分拣包裹。这一过程完全依靠机器人的视觉系统自主完成识别、抓取和分拣动作,标志着具身智能的一个重要里程碑。
当前具身智能的核心是智能体(Agent)。如今,机器人已迈向基于模型的端到端推理阶段,不再只是按照预设程序完成单一动作,而是要依靠自身视觉系统识别环境、理解目标、规划动作,并在持续变化的物理世界中完成任务。谁能更好地让机器人看懂世界、推理任务、想象后果并执行动作,谁就更接近通用具身智能的核心。

国内具身智能领域传来一个重要进展,北京人形机器人创新中心在全球权威评测WorldArena中取得突破。其发布的Pelican-Unify 1.0具身大一统模型登顶榜单,EWM Score稳居榜首,3D Accuracy接近满分。此前,北京人形发布的WoW具身世界模型也曾在WorldArena Data Engine赛道上获得Hugging Face官方推荐,并被斯坦福等顶尖团队引用。这意味着北京人形成为全球唯一同时登顶WorldArena两大核心赛道的机构,跻身具身大脑能力世界第一梯队。

从榜单成绩来看,Pelican-Unify 1.0以66.03的得分位居榜首,在多维度评估中表现出色。特别是在3D Accuracy上达到了98.12,接近满分,显示出该模型具备接近真实世界的空间建模能力。这不仅意味着模型生成的画面质量高,更重要的是它能准确理解和重建场景中的空间关系,对机器人至关重要。

自2025年以来,智能体成为AI行业的热门词汇。OpenAI、谷歌等公司纷纷押注,国内大模型厂商也积极参与。智能体的核心逻辑是让模型不仅能回答问题,还能完成任务,感知环境、制定计划、调用工具、持续执行。这一逻辑在数字世界尚可实现,但在物理世界中面临更多挑战。

传统具身智能系统的逻辑更像是“堆积木”,各模块之间存在语义鸿沟,阻碍了机器人真正理解任务。北京人形提出了一条不同路径:让理解、推理、想象与行动在同一个模型内部协同演化。经过一年多的迭代与实践,这一思路在2026年5月得到验证,发布了首个“大一统”具身基础模型Pelican-Unify 1.0。

Pelican-Unify 1.0实现了三大统一:理解、推理和生成。架构上由一个视觉-语言模型和一个统一未来生成器构成。通过共享表征,使语言推理、视频想象和动作预测在共同的表征中相互约束、协同演化。实验结果表明,该模型在多个国际榜单上表现优异,展示了强大的专项能力。

北京人形的慧思开物平台定位为全球首个“一脑多能、一脑多机”的通用具身智能平台。Pelican-Unify 1.0作为平台的首发版本,提供了真正的认知内核,实现了在同一理解-推理-想象-行动回路下的自然泛化。这一能力在实际硬件上得到了验证,模型在工业机械臂和人形机器人上的操作任务中全面超越了模块化基线方法。

经过一年多的场景打磨,慧思开物已从技术演示走向可量产的工业落地。搭载慧思开物的“具身天工2.0”进入福田康明斯发动机工厂,完成了料箱取放与搬运任务。此外,慧思开物SDK开放,面向高校与产业伙伴构建开源生态,并在世界人工智能大会上展示了分布式具身智能体系统的协同能力。

北京人形的身份在国内具身智能版图中具有独特性,由多家企业和资本共同发起,确立了国家级创新平台定位。软硬件层面,北京人形发布了新一代通用机器人平台具身天工3.0,实现了触物交互式全身高动态运动控制。Pelican-Unify 1.0的成功不仅是技术突破,更是系统性能力积累的体现。

2026年,具身智能行业正处于技术分层时刻。头部企业已跨过千台乃至万台交付门槛,行业核心问题转变为如何在新场景中真正好用。Pelican-Unify 1.0给出了一个早期但有说服力的答案,推动了从功能拼凑到闭环智能的转变。

配资在线机构论坛网
刚速查提示:文章来自网络,不代表本站观点。