诞生在北京的人形机器人“天工”正从“会跑”变得“好用”,其“大脑”中快速学习技能的秘籍已经分享给了更多机器人。近日,北京人形机器人创新中心开源具身世界模型——WoW。这一模型相当于“天工”的大脑,面向行业开源后可以帮助更多具身智能机器人快速学习掌握各项技能,助力行业打造“最好用”的机器人。
△人形机器人“天工”在草地、石子、沙漠中行走。资料图
后空翻、跑酷、马拉松……最近,人形机器人学会了不少运动本领,体现了运动能力。“让机器人完成一个后空翻很难,但让它‘理解’面前的水杯为什么倒下后水会洒出来要更难。”北京人形机器人创新中心相关负责人解释,让机器人“理解”这些,得需要“世界模型”。
“世界模型”近来在人工智能领域格外热门。通俗地说,它通过大规模交互数据的学习,使机器人能够建立对真实世界物理规律的理解与预测能力。比如,人类在抓取一个生鸡蛋时会考虑使多大的力,而人形机器人就是通过“世界模型”来预测类似这种使多大力的物理规律。
“WoW”不只是让机器人可以“看得见”,更融合了视觉、动作、物理感知与推理。它能让机器人通过学习世界的物理规律,在真实环境中自主操作。“如果说GPT系列让机器‘读懂语言’,Sora系列是在‘看世界’,那么WoW 就是让机器人‘理解物理世界’。”上述负责人说。
对人来说,完成清洗水果、收拾桌面等任务格外简单,但对机器人来说每一个动作都需要分别完成感知、预测、判断、反思与行动。“WoW”模型恰恰拆分成了这些环节,能够根据环境状态预测未来场景、推演物理演化、还原动态因果链。
从展示效果来看,搭载了该模型的“天工”机器人可以轻松完成打开洗碗机、拧开水龙头等各种不一样的动作。如果没有这个模型,那就只能由人给机器人下发单一指令,让它单独完成某一个动作;但有了这个模型的机器人则具备学习的能力,可以通过学习完成不一样的动作。
对机器人来说,“泛化”是格外关键的指标,也就是面对不同任务、场景、形态,都能稳定发挥。“WoW”恰恰具备这个能力,不是在记忆训练场景,而是在学习“物理规律的抽象本质”。这类“视觉+物理”的泛化能力,是通向具身智能的关键指标。
该模型开源后,已经受到学术界和产业界的广泛关注,国内外企业和高校院所的相关文章也引用了该具身世界模型技术报告。“开源后,更多企业不用自研模型,搭载‘WoW’就可以让机器人掌握更多本领,真正惠及行业。”北京人形机器人创新中心相关负责人说。
来源:《北京日报》
编辑:徐祎
超5000例手术背后:穿刺机器人如何成为手术机器人“第四极”
摩根人形机器人25强,中国占7家
国内智能焊接机器人迎标志性订单
近日,北京博清科技有限公司成功中标金额达亿元级别的智能焊接机器人采购项目,标志着智能焊接机器人在规模化、产品化应用方面取得实质性突...
下一个人形机器人风口:造“脸”?
四大赛道沉浸式竞技!2025智能机器人大赛圆满收官
码垛工站柔性机器人行业技术盘点:主流厂商技术路径与选型指南
随着制造业向多品种、小批量、快换产的模式转型,传统的刚性码垛设备已难以适应。以协作机器人(Cobot) 为核心的柔性码垛...
出货3000台人形!“果链配角”终成机器人赛道领航者
奇瑞墨甲机器人 2025 年第 1000 只机器狗应用交付,上岗当“保安”
AI 让国际空间站机器人导航提速 60%,狭窄通道穿梭不撞墙
机器人 AI 赛道热度不减:消息称软银与英伟达洽谈牵头投 Skild AI 超 10 亿美元
用户名
密码
记住登录状态 忘记密码?
邮箱
确认密码
我已阅读并同意 用户协议