0

0

突破具身智能“专家困境”!北大新方法让宇树 G1 靠单一框架掌握跳舞和侧手翻

霞舞

霞舞

发布时间:2025-09-09 08:05:02

|

468人浏览过

|

来源于php中文网

原创

人形机器人在跳舞这项技能上,正变得愈发得心应手。

比如跳一曲查尔斯顿舞,持续一分四十秒的流畅摇摆,动作稳定得仿佛精准踩在节拍器上:

但问题是,它们是否能像人类一样,在舞蹈、体操和日常操作之间自如切换?

由北京大学与 BeingBeyond 团队联合推出的 BumbleBee 系统给出了肯定的回答。该系统采用创新的“分治 - 精炼 - 融合”三级架构,首次实现了人形机器人在多种动作模式下的稳定控制,为人形机器人的通用运动能力开辟了新路径。

突破“专家困境”与“现实鸿沟”

长期以来,人形机器人的控制策略受限于两大难题:

专家困境:针对单一任务优化的策略虽然高效,但导致系统复杂度激增,难以扩展至多场景应用。

现实鸿沟:在仿真环境中训练出的策略,一旦迁移到真实世界,性能往往大幅下滑,动作稳定性与准确性难以维持。

BumbleBee 系统通过“分治 - 精炼 - 融合”的三阶段设计,成功打通了从专用专家策略到通用全身控制的链条,为具身智能的通用控制提供了全新范式。

 突破具身智能“专家困境”!北大新方法让宇树 G1 靠单一框架掌握跳舞和侧手翻

运动与语义双驱动:构建动作理解的“双通道”

系统通过多模态特征提取与隐空间联合对齐,实现动作在运动学与语义层面的深度融合:

  • 运动学特征提取:基于 SMPL 格式的人类动作数据,利用前向运动学转换为世界坐标系下的 3D 关节位置(如头部、骨盆、四肢关键点),并融合脚部速度、根节点位移等动态信息,最终通过 Transformer 进行编码。

  • 语义特征编码:使用 BERT 模型处理动作文本描述(例如“托马斯回旋:身体水平旋转360度,双手支撑地面”),再经 Transformer 映射至与运动特征维度一致的隐空间。

  • 联合隐空间对齐:通过对比学习,将语义与运动特征在统一隐空间中对齐,使语义相近或动作相似的行为在空间中彼此靠近,形成统一的动作表征。

  • K-means 聚类:在对齐后的隐空间中对动作数据进行自动聚类,生成结构化动作类别。相比人工分类,该方法能更自然地捕捉动作的语义与运动特征关联,提升分类一致性。

弥合仿真与现实之间的“鸿沟”

  • 专家策略训练:在每个动作簇内独立训练高精度运动跟踪策略,并引入增量动作模型(Delta Action)来补偿仿真与真实环境间的物理差异(如电机响应延迟、地面摩擦变化)。

    Lumen5
    Lumen5

    一个在线视频创建平台,AI将博客文章转换成视频

    下载
  • 多专家融合为通用策略:采用 DAgger 算法将多个专家策略的知识蒸馏至一个统一的通用策略中,实现不同动作间的无缝切换。在 MuJoCo 仿真中,通用策略任务成功率达 66.84%,远超基线方法(最高仅 50.19%);在真实机器人上,连续数分钟的复杂舞蹈动作执行成功率高达 100%

实验验证:数据驱动的性能飞跃

在 IsaacGym 与 MuJoCo 仿真平台上的全面测试中,研究人员采用任务成功率(SR)、平均关节角误差(MPJPE)、关键点误差(MPKPE)等指标进行评估:

在物理更真实的 MuJoCo 环境中,BumbleBee 的任务成功率达到 66.84%,显著领先于现有方法。

 突破具身智能“专家困境”!北大新方法让宇树 G1 靠单一框架掌握跳舞和侧手翻

真实机器人测试:稳定性与灵活性兼备

部署于 Unitree G1 机器人平台后,系统展现出卓越表现:

  • 动作稳定性:轻松完成长时间、高节奏的舞蹈序列。

  • 高难度动作执行:可完成托马斯回旋、侧手翻等体操级动作,展现强大动态控制能力。

未来,研究团队计划在以下方向持续推进:

  • 多模态感知融合:融合视觉-惯性里程计与触觉反馈,提升在动态环境中的适应能力。

  • 自然语言驱动控制:实现通过自然语言指令直接生成动作序列,例如输入“跳一段欢快的舞蹈”,即可自动生成并执行相应动作。

项目主页:https://www.php.cn/link/0ebd0b8b51eb0d0062065a7657486c8e
论文链接:https://www.php.cn/link/e2e57ded5b59a2058dd5855564c6b5ea

别忘了「点赞」「转发」「小心心」一键三连!

欢迎在评论区分享你的看法!

— 完 —

点亮星标,不错过每一条科技前沿动态

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

3098

2026.01.21

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

482

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2740

2024.08.16

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

6

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

5

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

8

2026.02.28

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

14

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

17

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

2

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 7.7万人学习

【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2.1万人学习

ECMAScript6 / ES6---十天技能课堂
ECMAScript6 / ES6---十天技能课堂

共25课时 | 2.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号