AI可从2D图像生成3D环境,无需事先对环境进行分析

使用一种基于 AI 的方法,只需一个 RGB 摄像机就可以捕捉 3D 场景。该方法名为 Atlas,由 Magic Leap 研究人员提出。它通过两个神经网络来从 2D 图像生成 3D 环境,无需事先对环境进行 3D 分析,例如通过立体摄像机或特殊雷达系统。研究人员认为,使用 AI 基于 2D 图像的 3D 重建比基于 3D 数据的重建更有效。

为图像分析而优化的神经元网络将单个 2D 图像独立分割,并基于摄像机数据创建一个简单的体素 3D 模型。可将这种背投技术想象成是通过环顾建筑物并透过每个窗户来绘制建筑物平面图。你不能看到所有的东西,但能从许多不同的角度的记录来构建一幅连贯的内部全景图。

第二个神经网络用于 3D 距离估计,并通过细化和补充来完善 3D 模型。对于扫描过程中被掩蔽的区域,AI 会用匹配的图像信息填充。AI 在训练中通过 ScanNet 数据集学习这些信息,ScanNet 数据集包含高质量和有文档记录的 3D 扫描。

研究人员表示,他们基于 AI 的 2D-3D 重建方法优于依赖基于硬件的环境 3D 分析的定量和定性常见且更复杂的方法。

然而,快速的 PC 硬件是一个先决条件:在 Nvidia Titan RTX 上,重建速度目前约为每秒 14 帧。因此,3D 重建技术的应用还有很长的一段路要走:3D 重建(例如用于 AR 眼镜)可以实时地以 3D 方式测量房间并精确地将数字对象放置在其中。

研究人员在 Github 免费提供他们的源代码。研究论文等更多信息可在官方项目页面上找到。【数字叙事 Lighting】

有问题和想法?与数字诗人讨论、交流,以获得更多的信息、意见。

赞赏
lighting
lighting
笛卡尔的“思”正在进入明斯基的“情感机器”
本文系数字叙事原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

1条评论

订阅

受欢迎的

相关文章
Related