编译/VR陀螺
近日,知名GPU企业英伟达推出了一项名为3D MoMa的AI技术,该技术可将静态照片转换为创作者可以轻松修改的3D模型。
这项技术为游戏工作室提供了一种改变图像和场景的简单方法。此前这项工作需要依赖于比较耗时的摄影测量,而3D MoMa通过逆向渲染提高了工作效率。
这个过程使用人工智能分析静止图像来估计场景的集合、照明等物理属性,然后以逼真的3D形式重建图片。
英伟达图形研究副总裁David Luebke将该技术描述为“统一计算机视觉和计算机图形的圣杯”。
图源:英伟达
他指出:“通过将逆向渲染问题的每一块都制定为GPU加速的可微分组件,英伟达3D MoMa渲染管道利用现代人工智能设备和英伟达GPU的原始计算能力,快速生成3D对象,创作者可以在现有工具中不受限制地进行导入、编辑和扩展等工作。”
3D MoMa将物体生成为三角形网络,这种格式可以直接使用常见的创作工具进行编辑。这些模型可通过Nvdia Tensor Core GPU在一小时内创建完毕。此外,模型还可以改变材质,也可以预测场景照明光路,这提高了模型的后期空间。
本周3D MoMa技术在新奥尔良举办的计算机视觉和模式识别会议(CVPR)上做了展示,为了向爵士乐的发源地致敬,英伟达的研究人员使用该技术呈现了不同的音乐流派。
该团队收集了数百张小号、长号、萨克斯管、鼓和单簧管的图片,然后对它们进行了3D模型重建。此外,它们又对这些乐器进行了重新编辑,比如说把它们的材质由塑料变成了黄金。
这些经过编辑的3D模型可以放入任何虚拟场景中,英伟达把它们放进了一个用于测试渲染质量的康奈尔盒子中。该公司表示,所有乐器都像现实世界中一样能对光做出反应,从照片中能看到铜管乐器和鼓皮的光线明暗变化。
图源:英伟达
目前3D MoMa仍在开发中,不过英伟达相信它可以让游戏开发人员和其他设计师快速修改3D对象,然后将它们添加到任何虚拟场景中。
来源:thenextweb
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息