0

0

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

WBOY

WBOY

发布时间:2023-09-26 22:01:01

|

929人浏览过

|

来源于搜狐

转载

达奇AI论文写作
达奇AI论文写作

达奇AI论文辅助写作平台,在校学生、职场精英都在用的AI论文辅助写作平台

下载

mr系统可以使用多个摄像头,但在呈现图像时需要对齐图像。然而,图像对齐是一个具有挑战性的问题。因此,在名为“利用角点和线特征进行图像对齐的方法”的专利申请中,微软提出了一种解决方案

当然,行业早已存在利用角特征来进行图像对齐的方法。然而,在图像中识别角并根据识别的角对齐图像是一个耗时且计算密集型的操作。

微软提出的是一种更有效的改进技术,可以实现更好的特征匹配。发明主要介绍了使用角特征和线特征来执行视觉对齐的混合方法,而这种解决方案导致对齐过程中所需的约束更少,从而改进计算效率和特征匹配。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

图11示出一个示例环境1100,其中用户正在使用头显摄像头1105和外部摄像头1110。如前所述,需要对齐从这两个摄像头生成的图像内容。但环境1100可能是一个弱光环境,或者可能是一个在热梯度或对比度方面具有低对比度的环境。

例如,在深夜物体冷却后,环境的温度梯度可能通常是均匀的。在这种情况下,环境的温度曲线或梯度可能低于特定的等温阈值1115。在这种情况下,用于对齐内容的传统技术可能会失效。微软描述的实施例为这类场景提供了解决方案。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

图12示出可用于对齐图像的示例角检测1200过程。图12示出了由图11的头显摄像头1105生成的第一图像1205,以及由外部摄像头1110生成的第二图像1210。

进行角检测操作以识别图像中存在的“角”。举例来说,可以通过实施例来识别第一张图像中的角特征。换句话说,可以在图像中识别一组像素,确定这些像素集合对应于一个角

“角”是指具有非均匀强度的一个或多个像素,其具有相对于所述一个或多个像素水平定位的第一附近像素块和相对于所述一个或多个像素垂直定位的第二附近像素块。换句话说,角定义为一组一个或多个与相对于像素集在X和Y方向相邻角形成对比的像素。

识别第一图像1205中的角特征1215,并且也识别第二图像1210中的角特征。因此,成功识别出角特征1225。需要注意的是,角特征1225与角特征1215是相对应的

为了对齐图像内容,该实施例的任务是识别1230个角的阈值。角的阈值数量必须相互对应。换句话说,必须识别在第一张图像1205中识别的多个角,并且必须与在第二张图像1210中识别的多个角相对应

如果满足这些阈值,则实施例可以执行图像对齐操作以生成叠加图像1235,所述图像1235是其中对齐来自第二图像1210的内容,然后与来自第一图像1205的相应内容覆盖的图像。

进行角点检测和对齐是一项计算密集型操作,如果检测到的角点与图像之间的匹配不够好,整个过程可能会失败。例如,仅使用角点的方法,需要从一张图像中识别出至少5个角点,然后与第二张图像中的相应角点进行匹配。在低对比度条件下,即使识别出5个相应的角点也可能是一项挑战

在识别足够数量的角之后,实施例然后使用运动模型识别3D旋转,以便通过执行各种旋转和转换以使5个角彼此对齐来将图像内容从第一或第二图像适配到另一图像。执行这样的对齐是计算密集型。

因此,我们需要减少只使用角方法时所存在的约束,而图13则描述了这样一种技术。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

在图13中展示了角点和线点检测1300的过程,这个过程包括了图12中的角点检测1200操作和线点检测操作的组合。需要注意的是,角点检测操作和线检测操作是同时进行的

通常情况下,识别图像中的相应的“线”比识别角点更简单,因此线检测过程通常比角点检测过程更快。由于这两个过程可以并行运行,并且线检测过程更快,因此添加线检测过程不会对整体对齐过程的速度产生负面影响

通过合并使用线条来对齐图像,可以在对齐过程中使用更少的角,从而导致放松的约束和通常更容易对齐。特别是在低温条件下,要求使用更少的角是非常有益的,因为很难找到和匹配角

“线”被定义为一组一个或多个像素,它们具有相对于一组或多个像素集的水平定位的第一附近像素块的均匀强度,并且具有相对于一组或多个像素集的垂直定位的第二附近像素块的不均匀强度。或者,它们具有相对于一组或多个像素集的水平定位的第一附近像素块的不均匀强度,并且具有相对于一组或多个像素集的垂直定位的第二附近像素块的均匀强度

在图13中,展示了代表图12中图像的第一图像1305和第二图像1310。图13还展示了一种实施方法,可以检测第一图像1305中的角特征1315

在对第一图像1305进行角特征的例检测时,同时也会进行线特征的检测,就像线特征1320和线特征1325所示的那样。一般来说,相较于可以检测到的角的数量,我们能够检测到更多的线

对第二图像1310执行角和线操作。为了说明,所述实施例识别角特征1330。与角检测操作并行,实施例同时检测第二图像1310中的线,如线特征1335和线特征1340。

请注意,角特征1330与角特征1315相对应;线特征1335与线特征1320相对应。线特征1340与线特征1325相对应。实施例可以识别这些对应关系,然后生成或使用适合于将这些特征点彼此对齐的运动模型

根据发明原理,我们定义了第一个阈值为1345。第一个阈值是指必须在两个图像中识别的相应角特征的数量,以便对它们进行对齐。同时,我们还定义了第二个阈值为1350。第二个阈值是指必须在两个图像中识别的相应行特征的数量,以使它们对齐

第一阈值1345和第二阈值1350的满足使实施例能够对齐来自第一图像1305和第二图像1310的内容以生成叠加图像1355。值得注意的是,阈值通常是指必须识别的角和线的总数。

在了解执行线特征检测的便利性和速度之后,你可能会质疑为什么实施例不仅依赖于线检测操作而避免执行角检测操作。原因是因为在图像中检测线条会导致孔径问题。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

以下是重写后的内容: 根据图14,我们可以看到孔径问题,即孔径模糊度为1400。在图14中,线段1405是整条线的一部分。孔径模糊度1400指的是一条线的多个不同部分可能(但不正确地)与已识别的线段1405相关

例如,尽管线段1410实际上位于错误的位置或位置,但线段1410可能是与线段1405匹配的像素块。类似地,线段1415或线段1420可能包含可能映射或匹配线段1405中的像素的像素块。这样的场景在对齐过程中引入了模糊性。

因此,依靠线检测过程本身是不够的技术。换句话说,依靠线和角的组合可以使实施例使用宽松的约束,从而提高计算效率。

微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐

示例过程流1500在图15中展示。最初,会获取一组图像,如头戴式摄像头图像1505和外部摄像头图像1510。这些图像可能是热图像。图像中的温度梯度或对比度1520可能低于特定的对比度阈值1525。因此,在图像中识别足够数量的角可能相当困难。在这种情况下,可以利用混合方法检测角和线的组合以实现对齐

将头戴式摄像头图像1505和外部摄像头图像1510传送到角度检测器1530和线条检测器1535中,这两个检测器同时运行,彼此之间没有依赖关系

请注意,线检测器1535在检测线条时通常比角检测器1530在检测角度时更快。换句话说,线检测器1535的延迟时间较角检测器1530的延迟时间要短

角点检测器1530分析所述两个图像并识别所述图像中的角点1545。类似地,线检测器1535分析这两个图像并识别图像中的线1550。然后,实施例通过在两个图像内识别相应的角和线来执行对齐1555。

为了执行对齐,需要确定线和角的阈值数量。匹配阈值比识别角的数量或线的阈值更相关。然后,实施例将所识别的角和线拟合到诸如运动模型的3D模型1560中。然后对模型1560进行模型拟合1565操作,以旋转、平移和/或变换一幅图像,从而匹配或对齐另一幅图像中的相应角和线。

换句话说,当执行重投影操作时,实施例使用已识别的角和线来对齐来自一个图像的内容与来自另一个图像的内容

相关专利:Microsoft Patent | Image alignment using corner and line features

名为“Image alignment using corner and line features”的微软专利申请最初在2022年2月提交,并在日前由美国专利商标局公布。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
vsd文件打开方法
vsd文件打开方法

vsd文件打开方法有使用Microsoft Visio软件、使用Microsoft Visio查看器、转换为其他格式等。想了解更多vsd文件相关内容,可以阅读本专题下面的文章。

509

2023.10.30

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

45

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

41

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

37

2026.02.28

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

21

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

18

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

3

2026.02.27

漫蛙app官网链接入口
漫蛙app官网链接入口

漫蛙App官网提供多条稳定入口,包括 https://manwa.me、https

243

2026.02.27

deepseek在线提问
deepseek在线提问

本合集汇总了DeepSeek在线提问技巧与免登录使用入口,助你快速上手AI对话、写作、分析等功能。阅读专题下面的文章了解更多详细内容。

21

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 4万人学习

Excel 教程
Excel 教程

共162课时 | 19.6万人学习

PHP课程
PHP课程

共137课时 | 12.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号