使用一种基于 AI 的方法,只需一个 RGB 摄像机就可以捕捉 3D 场景。该方法名为 Atlas,由 Magic Leap 研究人员提出。它通过两个神经网络来从 2D 图像生成 3D 环境,无需事先对环境进行 3D 分析,例如通过立体摄像机或特殊雷达系统。研究人员认为,使用 AI 基于 2D 图像的 3D 重建比基于 3D 数据的重建更有效。
为图像分析而优化的神经元网络将单个 2D 图像独立分割,并基于摄像机数据创建一个简单的体素 3D 模型。可将这种背投技术想象成是通过环顾建筑物并透过每个窗户来绘制建筑物平面图。你不能看到所有的东西,但能从许多不同的角度的记录来构建一幅连贯的内部全景图。
第二个神经网络用于 3D 距离估计,并通过细化和补充来完善 3D 模型。对于扫描过程中被掩蔽的区域,AI 会用匹配的图像信息填充。AI 在训练中通过 ScanNet 数据集学习这些信息,ScanNet 数据集包含高质量和有文档记录的 3D 扫描。
研究人员表示,他们基于 AI 的 2D-3D 重建方法优于依赖基于硬件的环境 3D 分析的定量和定性常见且更复杂的方法。
然而,快速的 PC 硬件是一个先决条件:在 Nvidia Titan RTX 上,重建速度目前约为每秒 14 帧。因此,3D 重建技术的应用还有很长的一段路要走:3D 重建(例如用于 AR 眼镜)可以实时地以 3D 方式测量房间并精确地将数字对象放置在其中。
研究人员在 Github 免费提供他们的源代码。研究论文等更多信息可在官方项目页面上找到。【数字叙事 Lighting】
[…] Magic Leap 也研发出一种通过神经网络来从 2D 图像生成 3D 环境的方法,名为 Atlas。其研究人员认为,使用 AI 基于 2D 图像的 3D 重建比基于 3D […]