0

0

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

PHPz

PHPz

发布时间:2023-06-19 14:43:18

|

1035人浏览过

|

来源于51CTO.COM

转载

「唯一真正的探索之旅,不是去拜访陌生的土地,而是透过别人的眼睛来观察宇宙。」——马塞尔·普鲁斯特

通过别人的眼睛来看世界,这个又科幻又诗意(又恐怖)的想法,已经成真了!

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

《黑镜》第一季《你的全部历史》

现在,我们只需利用眼睛的反光,就能三维重建这个人正在观察的物体。

是的,这很黑镜。


眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷


眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

最近,来自马里兰大学的团队,提出一种全新的方法——通过利用包含眼睛反光的人像,来对摄像机没有拍到的场景进行三维重建。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

论文地址:https://arxiv.org/abs/2306.09348

项目地址:https://world-from-eyes.github.io/

Runway
Runway

Runway是一个AI创意工具平台,它提供了一系列强大的功能,旨在帮助用户在视觉内容创作、设计和开发过程中提高效率和创新能力。

下载

经典科幻中的场景都成真了?

用眼睛反射产生辐射场重建?这个想法看似疯狂,实则有足够的理论依据。

作者介绍说,因为人眼具有高度的反射性,所以从捕捉头部移动的一系列帧中,完全可以做到仅使用眼睛的反射,就能重建和渲染人们正在观察的3D场景。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

鉴于这个概念非常「黑镜」,而且这篇论文一发布没几个小时,《黑镜》新一季就宣布上线了,这种巧合简直让人怀疑《黑镜》的导演是不是也注意到了这篇论文。(狗头)

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

黑镜第六季今日上线

这项研究一出,网友们直接炸了。

所以,我们已经快进到这一步了?

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

这不就是2000年代《攻壳机动队》中的场景吗?这些虚构全都变成现实了!

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

100%的《银翼杀手》,现在就给我一份拷贝吧。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

儒勒·凡尔纳的《基普兄弟》成真了!

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

当然,也有人对此表示毛骨悚然:这个技术可千万别被用于调查取证之类的事情。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

而在今天,我们已经有了Varjo眼动追踪相机,还有苹果的VisionPro以及其他头显,这些设备都可以捕捉大量镜头素材,结合进这项新技术,无数崭新的科幻场景,恐怕马上都要成真了……

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

通过利用光线在人眼上的微小反射,研究团队开发了一种方法,可以使用在固定相机位置拍摄的单目图像序列来重建人所观察到的(非直视)场景。

不过,仅仅在观察到的反射上训练辐射场是不够的,原因有几个:1)角膜定位中的固有噪声,2)虹膜纹理的复杂性,3)每张图像中捕获的低分辨率反射。

为了解决这些挑战,团队在训练过程中引入了角膜姿态优化和虹膜纹理分解,并借助基于人眼虹膜的径向纹理正则化损失。

与传统的需要移动相机的神经场训练方法不同,他们使用的方法将相机放置在固定的视点上,完全依赖于用户的移动。

利用人眼反光,实现场景重建

由于准确估计眼睛的姿态十分困难,再加上虹膜和场景反射之间的纹理相互交织,因此这项任务颇具挑战性。

为了解决这一问题,作者针对眼睛姿态、描述场景的辐射场以及观察者的眼睛虹膜纹理,进行了联合优化。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

具体来说,主要的贡献有三点:

1. 新的三维重建

提出了一种从眼睛图像中重建观察者世界的3D场景的新方法,可以将先前的基础工作与神经渲染的最新进展相结合。

2. 虹膜的径向先验

引入了虹膜纹理分解的径向先验,显著提高了重建的辐射场的质量。

3. 角膜姿态的优化

开发了一种角膜姿态优化的过程,以减轻眼睛姿态估计的噪声,克服了从人眼中提取特征的独特挑战。

结果显示,利用这个全新的方法,我们可以通过移动画面,从眼睛的反射中获得场景的多个视角,最终实现完整的场景重建。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

更厉害的是,团队还尝试利用Miley Cyrus和Lady Gaga的MV,来重建她们眼睛里的景象。

作者表示,他们成功地重建了出现在Miley的眼中的物体,并且从Lady Gaga的眼中似乎看到了一个人的上半身。

然而,由于这些视频的质量不够高,因此还不能断定重建结果的准确性。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

Lady Gaga

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

Miley Cyrus

如何做到的?

众所周知,健康成年人的角膜几何形状几乎相同。

因此,只需在图像中计算一个人的角膜的像素大小,就可以准确计算出他们的眼睛位置。

接下来,作者通过从相机拍摄光线,并将它们反射出近似的眼睛几何形状,来训练眼睛反射的辐射场。

为了避免人眼的虹膜在重建中出现,作者同时训练了一个学习虹膜纹理的二维纹理映射,来进行纹理分解。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷


眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷


眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷


眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

实验评估

合成数据评估

首先,作者通过在Blender场景中放置人眼模型,进行了合成数据上的评估。

下图展示了仅利用眼睛反射重建的场景。

由于在现实生活中无法完美估计眼角膜,作者和评估了角膜姿态优化对估计角膜半径噪音的鲁棒性。

为了模拟真实数据中可能遇到的深度估计误差,作者通过使用不同噪音水平对每个图像中观察到的角膜半径进行缩放,来破坏观察到的角膜半径r_img。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

下图展示了在不同噪音水平下的性能变化。

值得注意的是,随着噪音的增加,与无姿态优化的重建相比,作者提出的姿态优化重建在重建的几何形状和颜色方面更为鲁棒。

这证明姿态优化对于现实场景至关重要,因为图像中从投影的角膜到初始椭圆拟合并不完美。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

此外,在有无纹理分解的情况下的定量比较显示,作者的方法在SSIM和LPIPS方面在纹理分解的情况下表现更好。

值得注意的是,作者没有计算PSNR,因为在设置中,反射和场景本身之间的照明差异非常大。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

真实世界评估

为了保证视野的真实,作者选择了索尼RX IV相机进行拍摄,并使用Adobe Lightroom对图像进行后处理,以减少角膜反射中的噪声。同时,作者在人物的两侧加入了光源来照亮目标物体。

过程中,被拍的人需要在相机的视野范围内移动,以便团队在每个场景中拍摄5-15帧图像。

由于场景照明具有较大的动态范围,作者在所有实验中使用16位图像,以避免丢失观察到的反射中的信息。

平均而言,每个图像中角膜只覆盖约0.1%的区域,而目标物体大约会占到20x20像素,并与虹膜纹理交错。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

数据处理

作者首先通过对图像进行角膜中心和半径的估计,来获得角膜的初始位置估计。

然后,使用平均深度和相机的焦距直接近似来计算角膜的三维位置,并计算其表面法线。

为了自动化这个过程,作者使用Grounding Dino定位眼睛的边界框,并使用ELLSeg对虹膜进行椭圆拟合。

尽管角膜通常被遮挡,但我们只需要未遮挡的区域,因此可以使用Segment Anything来获得虹膜的分割掩码。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

真实结果

从下图展示的效果中可以看出,作者的方法能够从真实世界的人像图片中重建3D场景,尽管存在角膜位置和几何估计的不准确性。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

由于角膜边界的模糊性,想要在图像中实现精确的定位十分困难。

此外,对于某些眼睛颜色,如绿色和蓝色,3D重建也会更加困难,因为虹膜纹理较亮。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

此外,在没有明确建模纹理时,重建后的画面中还会出现更多的「漂浮物」。

为了解决这些问题,可以通过增加径向正则化的程度,来改善重建的质量。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

不过,这个方法依然存在两个主要的限制。

首先,目前的真实世界结果是基于「实验室设置」,例如对人脸进行放大拍摄、使用额外的光源照亮场景等。而在更自由的环境中,就需要面对传感器分辨率较低、动态范围较小且存在运动模糊等更大的挑战。

其次,目前对虹膜纹理的假设(例如恒定纹理、径向恒定颜色)可能过于简化,因此该方法在眼睛大幅度旋转时可能会失效。

作者介绍

共同一作Kevin Zhang,目前是马里兰大学的博士生。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

Brandon Y. Feng在马里兰大学获得计算机科学博士学位,研究兴趣集中在计算成像、中层视觉和计算摄影领域。曾开发了用于图像和3D数据处理的机器学习算法,应用范围涵盖混合现实到自然科学等领域。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

Jia-Bin Huang是马里兰大学副教授,此前在UIUC获得了博士学位。研究兴趣集中在计算机视觉、计算机图形学和机器学习的交叉领域。

眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

403

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1992

2024.08.16

传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

468

2024.06.04

PHP 命令行脚本与自动化任务开发
PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境(CLI)下的开发与应用,内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理,以及与 Linux 定时任务(Cron)的结合使用。通过实战示例,帮助开发者掌握使用 PHP 构建 自动化脚本、批处理工具与后台任务程序 的能力。

30

2025.12.13

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

75

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

109

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

152

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

79

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
前端小白零基础入门HTML5+CSS3
前端小白零基础入门HTML5+CSS3

共361课时 | 33.3万人学习

CSS3 3D 特效视频教程
CSS3 3D 特效视频教程

共14课时 | 3万人学习

7天教会你HTML5和CSS3视频教程
7天教会你HTML5和CSS3视频教程

共21课时 | 4.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号