0

0

突破具身智能“专家困境”!北大新方法让宇树 G1 靠单一框架掌握跳舞和侧手翻

霞舞

霞舞

发布时间:2025-09-09 08:05:02

|

468人浏览过

|

来源于php中文网

原创

人形机器人在跳舞这项技能上,正变得愈发得心应手。

比如跳一曲查尔斯顿舞,持续一分四十秒的流畅摇摆,动作稳定得仿佛精准踩在节拍器上:

但问题是,它们是否能像人类一样,在舞蹈、体操和日常操作之间自如切换?

由北京大学与 BeingBeyond 团队联合推出的 BumbleBee 系统给出了肯定的回答。该系统采用创新的“分治 - 精炼 - 融合”三级架构,首次实现了人形机器人在多种动作模式下的稳定控制,为人形机器人的通用运动能力开辟了新路径。

突破“专家困境”与“现实鸿沟”

长期以来,人形机器人的控制策略受限于两大难题:

专家困境:针对单一任务优化的策略虽然高效,但导致系统复杂度激增,难以扩展至多场景应用。

现实鸿沟:在仿真环境中训练出的策略,一旦迁移到真实世界,性能往往大幅下滑,动作稳定性与准确性难以维持。

BumbleBee 系统通过“分治 - 精炼 - 融合”的三阶段设计,成功打通了从专用专家策略到通用全身控制的链条,为具身智能的通用控制提供了全新范式。

 突破具身智能“专家困境”!北大新方法让宇树 G1 靠单一框架掌握跳舞和侧手翻

运动与语义双驱动:构建动作理解的“双通道”

系统通过多模态特征提取与隐空间联合对齐,实现动作在运动学与语义层面的深度融合:

  • 运动学特征提取:基于 SMPL 格式的人类动作数据,利用前向运动学转换为世界坐标系下的 3D 关节位置(如头部、骨盆、四肢关键点),并融合脚部速度、根节点位移等动态信息,最终通过 Transformer 进行编码。

  • 语义特征编码:使用 BERT 模型处理动作文本描述(例如“托马斯回旋:身体水平旋转360度,双手支撑地面”),再经 Transformer 映射至与运动特征维度一致的隐空间。

  • 联合隐空间对齐:通过对比学习,将语义与运动特征在统一隐空间中对齐,使语义相近或动作相似的行为在空间中彼此靠近,形成统一的动作表征。

  • K-means 聚类:在对齐后的隐空间中对动作数据进行自动聚类,生成结构化动作类别。相比人工分类,该方法能更自然地捕捉动作的语义与运动特征关联,提升分类一致性。

弥合仿真与现实之间的“鸿沟”

  • 专家策略训练:在每个动作簇内独立训练高精度运动跟踪策略,并引入增量动作模型(Delta Action)来补偿仿真与真实环境间的物理差异(如电机响应延迟、地面摩擦变化)。

    百度智能云·曦灵
    百度智能云·曦灵

    百度旗下的AI数字人平台

    下载
  • 多专家融合为通用策略:采用 DAgger 算法将多个专家策略的知识蒸馏至一个统一的通用策略中,实现不同动作间的无缝切换。在 MuJoCo 仿真中,通用策略任务成功率达 66.84%,远超基线方法(最高仅 50.19%);在真实机器人上,连续数分钟的复杂舞蹈动作执行成功率高达 100%

实验验证:数据驱动的性能飞跃

在 IsaacGym 与 MuJoCo 仿真平台上的全面测试中,研究人员采用任务成功率(SR)、平均关节角误差(MPJPE)、关键点误差(MPKPE)等指标进行评估:

在物理更真实的 MuJoCo 环境中,BumbleBee 的任务成功率达到 66.84%,显著领先于现有方法。

 突破具身智能“专家困境”!北大新方法让宇树 G1 靠单一框架掌握跳舞和侧手翻

真实机器人测试:稳定性与灵活性兼备

部署于 Unitree G1 机器人平台后,系统展现出卓越表现:

  • 动作稳定性:轻松完成长时间、高节奏的舞蹈序列。

  • 高难度动作执行:可完成托马斯回旋、侧手翻等体操级动作,展现强大动态控制能力。

未来,研究团队计划在以下方向持续推进:

  • 多模态感知融合:融合视觉-惯性里程计与触觉反馈,提升在动态环境中的适应能力。

  • 自然语言驱动控制:实现通过自然语言指令直接生成动作序列,例如输入“跳一段欢快的舞蹈”,即可自动生成并执行相应动作。

项目主页:https://www.php.cn/link/0ebd0b8b51eb0d0062065a7657486c8e
论文链接:https://www.php.cn/link/e2e57ded5b59a2058dd5855564c6b5ea

别忘了「点赞」「转发」「小心心」一键三连!

欢迎在评论区分享你的看法!

— 完 —

点亮星标,不错过每一条科技前沿动态

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

400

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1968

2024.08.16

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

34

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

14

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

33

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

18

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

12

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.13

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 5.6万人学习

【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2万人学习

ECMAScript6 / ES6---十天技能课堂
ECMAScript6 / ES6---十天技能课堂

共25课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号