0

0

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

WBOY

WBOY

发布时间:2023-11-13 11:29:31

|

1426人浏览过

|

来源于搜狐

转载

Favird No-Code Tools
Favird No-Code Tools

无代码工具的聚合器

下载

(映维网nweon 2023年11月13日)关于人类用户姿势的信息可以映射到虚拟铰接表示。例如,当参与虚拟现实环境时,人类用户在虚拟环境中的表现会呈现出与现实世界姿势相似的姿势。用户的真实世界姿态可以通过先前训练的模型转换为虚拟铰接表示的姿态,模型可以训练为输出用于最终渲染的相同虚拟铰接表示姿态。

有时候系统需要展示不真实的表现。例如,用户可以选择不同身体比例、骨骼或其他方面的卡通角色

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

根据图1所示,真实世界环境102中的人类用户100被展示出来。可以看到,人类用户的姿势被应用到铰接表示104上。换句话说,当人类用户在真实世界环境中进行活动时,相应的动作会转化为虚拟环境106中铰接表示104的运动

有时候,虚拟铰接表示与用于训练模型的表示可能不同,需要进行重新编写。为了解决这个问题,微软专利“Concurrent human pose estimates for virtual representation”介绍了一项技术,能够同时估计模型铰接表示和目标铰接表示的姿态

具体来说,计算系统至少部分地基于来自一个或多个传感器的输入,接收人类用户一个或多个身体部位的详细参数的定位数据。这些传感器可以包括头显的惯性测量单元输出,以及适当摄像头的输出

重写后的内容为:系统会同时维护一个或多个与目标关节表示相关联的模型关节表示的映射约束,例如关节映射约束。姿态优化机会通过定位数据和映射约束,同时估计模型关节表示的姿态和目标关节表示的目标姿态。一旦完成估计,系统可以将目标关节表示和目标姿势一起显示为虚拟表示,供人类用户查看

姿态优化机可以使用具有用于模型铰接表示的ground truth标签的训练定位数据进行训练。然而,训练定位数据可能缺乏目标铰接表示的ground truth标签。

通过这种方法,可以有效地实现对真实世界姿态的准确再现,而无需对每个不同的潜在目标进行昂贵的训练计算。这种技术的发明描述可以对人类用户产生积极的影响

当用户参与虚拟环境时,他们可以选择不同的Avatar来代表自己,并且可以在交流过程中随时改变外观。可以将新的目标铰接表示添加到可供用户选择的表示菜单中,而无需为特定表示重新训练模型,从而节省计算费用

发明描述的技术可以提供减少计算资源消耗的技术优势,同时准确地重新创建人类用户的真实世界姿势,并允许将准确的姿势应用于多个不同目标铰接表示中的任何一个。具体方法是通过同时估计目标和模型的姿势。

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

在图2中展示了用于虚拟表示人体姿势的示例方法200

在202,基于来自一个或多个传感器的输入,接收人类用户的一个或多个身体部位的详细参数的定位数据。

在204年,需要维护一个或多个与目标铰接表示相关的映射约束,以保证模型的连结。如图4所示,展示了一个示例模型铰接表示400

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

如上所述,目标铰接表示呈现用于在虚拟环境中显示,并且可以通过姿态优化机输出目标姿态来显示。例如,目标铰接表示可以具有任何合适的外观和比例,并且可以具有任何合适数量的肢体、关节和/或其他可移动的身体部位。

可以将其改写为:目标铰接表示可以代表非人类动物、虚构角色或任何合适的Avatar。模型铰接表示和目标铰接表示通过一个或多个映射约束402进行关联

一个或多个映射约束可以包括联合映射约束404。对于目标铰接表示的关节,关节映射约束指定模型铰接表示中的一组一个或多个关节。例如,模型铰接表示400包括多个关节,其中两个标记为403A和403B,其对应于肩关节和肘关节。

104号目标铰接包括类似的关节405A和405B。因此,目标表示的关节405A和405B可能有多个不同的关节映射约束,表示这些关节映射到模型表示的关节403A和403B

关节映射约束可以进一步指定每个模型关节在映射到目标关节表示时的权重。例如,当模型的铰接表示只有一个关节映射到目标铰接表示的特定关节时,该模型关节的权重可能为100%。而当两个模型关节映射到目标关节时,两个模型关节的权重可以是50%和50%、30%和70%、10%和90%等

在图2中,方法200通过对先前训练的位姿进行优化,同时估计模型铰接表示的模型位姿和目标铰接表示的目标位姿。模型位姿和目标位姿的估计至少部分依赖于定位数据

并行人体姿态估计专利:微软AR/VR技术实现虚拟表示

图5A示意性地示出了位姿优化机500的示例,其可以作为计算机逻辑组件的任何合适组合来实现。作为一个非限制性示例,位姿优化机500可以实现为如图6所述的逻辑子系统602。

如图5A所示,姿态优化机同时估计模型铰接表示的模型姿态502A和目标铰接表示的目标姿态502B。这至少部分地基于定位数据504和一个或多个映射约束506来完成。

姿态估计可以至少部分地基于在一个或多个先前时间框架估计的一个或多个先前模型姿态和先前目标姿态来完成。因此,位姿优化机器500存储多个先前的位姿506,其可以表示为每个模型关节的多个局部旋转。

一个或多个映射约束可以包括位姿连续性约束,它施加帧对帧的限制,限制给定关节的局部旋转可以从一个帧改变到另一个帧的程度。 可以将一组映射约束应用于位姿连续性,通过限制帧与帧之间的变化程度,来约束给定关节的局部旋转

图5B以示意的方式展示了将估计的模型和目标姿态应用于模型和目标铰接表示的过程。具体来说,图5B再次展示了模型铰接表示400和目标铰接表示104对应的默认姿态407A和407B。然后,通过改变铰接的方向,使得模型铰接表示400假设模型姿态502A,目标铰接表示104假设目标姿态502B

在姿态优化中,需要同时估计模型的位姿和目标的位姿。换句话说,与其他方法不同,姿态优化机不是先输出模型的姿态表示,然后将其转换为目标的姿态表示。相反,姿态估计是同时找到满足一组约束的模型姿态和目标姿态的过程

例如,模型铰接表示的姿态可以受到姿态优化机器的先前训练的约束,以输出给定一组定位数据的可能的人类姿态,并且目标铰接表示的姿态可以受到将目标铰接表示与模型铰接表示相关联的一个或多个映射约束的约束。

另外,在先前的训练中,姿态估计可以由执行姿态优化的机器学习模型508来实现。在一个实例中,姿态优化机可以被配置为基于稀疏输入定位数据输出姿态。换句话说,姿态优化机可以通过训练来输出更准确的姿态估计,这取决于在运行时接收到的更多输入参数

换句话说,姿态优化机接收到的定位数据可能包含人类用户的n个关节的旋转参数。在之前的训练中,姿态优化机接收的是n+m个关节的旋转参数作为输入,其中m大于1。然后,估计模型的姿态可以通过估计模型铰接表示的n+m个模型关节的旋转参数来确定,至少需要基于n个关节的旋转参数,而不需要基于m个关节的旋转参数

另外,训练姿态优化机时,不需要包括目标铰接表示的ground truth标签。相反,通过一个或多个映射约束,将标铰接表示与模型铰接表示相关联,通常将目标姿态约束为与模型姿态基本相似

微软指出,采用上述技术,过程的速度可以有益地提高两个数量级。这可以实现模型和目标姿态的实时并发估计,而无需使用专门的硬件加速。

在图2中,方法200包括输出具有目标姿态的目标铰接表示作为人类用户的虚拟表示以供显示,该步骤发生在208。例如,在图1中,目标铰接表示104通过电子显示设备108进行展示。用于展示目标铰接表示的显示装置可以采用任何适当的形式,并且可以使用任何适当的底层显示技术

相关专利:Microsoft Patent | Concurrent human pose estimates for virtual representation

名为“Concurrent human pose estimates for virtual representation”的微软专利申请最初在2022年4月提交,并在日前由美国专利商标局公布。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

498

2024.06.04

vsd文件打开方法
vsd文件打开方法

vsd文件打开方法有使用Microsoft Visio软件、使用Microsoft Visio查看器、转换为其他格式等。想了解更多vsd文件相关内容,可以阅读本专题下面的文章。

510

2023.10.30

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

38

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

83

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

169

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号