诞生在北京的人形机器人“天工”正从“会跑”变得“好用”,其“大脑”中快速学习技能的秘籍已经分享给了更多机器人。近日,北京人形机器人创新中心开源具身世界模型——WoW。这一模型相当于“天工”的大脑,面向行业开源后可以帮助更多具身智能机器人快速学习掌握各项技能,助力行业打造“最好用”的机器人。
△人形机器人“天工”在草地、石子、沙漠中行走。资料图
后空翻、跑酷、马拉松……最近,人形机器人学会了不少运动本领,体现了运动能力。“让机器人完成一个后空翻很难,但让它‘理解’面前的水杯为什么倒下后水会洒出来要更难。”北京人形机器人创新中心相关负责人解释,让机器人“理解”这些,得需要“世界模型”。
“世界模型”近来在人工智能领域格外热门。通俗地说,它通过大规模交互数据的学习,使机器人能够建立对真实世界物理规律的理解与预测能力。比如,人类在抓取一个生鸡蛋时会考虑使多大的力,而人形机器人就是通过“世界模型”来预测类似这种使多大力的物理规律。
“WoW”不只是让机器人可以“看得见”,更融合了视觉、动作、物理感知与推理。它能让机器人通过学习世界的物理规律,在真实环境中自主操作。“如果说GPT系列让机器‘读懂语言’,Sora系列是在‘看世界’,那么WoW 就是让机器人‘理解物理世界’。”上述负责人说。
对人来说,完成清洗水果、收拾桌面等任务格外简单,但对机器人来说每一个动作都需要分别完成感知、预测、判断、反思与行动。“WoW”模型恰恰拆分成了这些环节,能够根据环境状态预测未来场景、推演物理演化、还原动态因果链。
从展示效果来看,搭载了该模型的“天工”机器人可以轻松完成打开洗碗机、拧开水龙头等各种不一样的动作。如果没有这个模型,那就只能由人给机器人下发单一指令,让它单独完成某一个动作;但有了这个模型的机器人则具备学习的能力,可以通过学习完成不一样的动作。
对机器人来说,“泛化”是格外关键的指标,也就是面对不同任务、场景、形态,都能稳定发挥。“WoW”恰恰具备这个能力,不是在记忆训练场景,而是在学习“物理规律的抽象本质”。这类“视觉+物理”的泛化能力,是通向具身智能的关键指标。
该模型开源后,已经受到学术界和产业界的广泛关注,国内外企业和高校院所的相关文章也引用了该具身世界模型技术报告。“开源后,更多企业不用自研模型,搭载‘WoW’就可以让机器人掌握更多本领,真正惠及行业。”北京人形机器人创新中心相关负责人说。
来源:《北京日报》
编辑:徐祎
破解人形机器人一致性可靠性痛点,这座中试平台为产业“搭桥梁”
千台机器人“毕业”!北京首个人形机器人中试验证平台运行
马斯克:人形机器人最大对手将来自中国,上班族需关注产业变革
2026年初,当特斯拉宣布停产ModelS和ModelX,将生产线全面转向Optimus人形机器人时,全球科技圈为之震动。更引...
北京首个人形机器人中试验证平台正式启动 预计年产能5000台套
马斯克:人形机器人领域最大竞争对手将来自中国
当地时间1月28日,特斯拉首席执行官马斯克在财报会议上表示,xAI公司的Grok可用于管理特斯拉的自动驾驶车队,或大规模的Opti...
中国机器人全球份额39%,马斯克直言最大对手在中国
春晚机器人凉了?2026年,机器人要少跳舞,多干活
春晚,中国机器人大秀!
“新同事” 都是1.8米专干苦活的机器人 温企解锁智造新步伐
机器人“扎堆”上春晚,谁将成为下一个“顶流”?
雷达财经出品文|丁禹编|孟帅继去年宇树机器人身穿大花袄扭秧歌火爆刷屏后,即将到来的马年春晚,全国观众将目睹多家机器人公司“扎堆...
用户名
密码
记住登录状态 忘记密码?
邮箱
确认密码
我已阅读并同意 用户协议