微信公众号

VR陀螺微信公众号

手机端

手机端扫码访问

游戏评测

推广

推广

推广

推广

最新资讯

英伟达发布新开源AI图像生成模型，可直接从单个2D图像生成3D模型

发布时间：2022-09-28 15:24 | 标签： Nvidia GET3D

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

编译/VR陀螺

英伟达新的AI模型GET3D旨在加快3D内容的创建速度。该模型可以在几秒钟内输出许多纹理的3D网格，可以在标准图形引擎中无缝使用，而这只需要一张2D图像作为输入即可。

GET3D是 " Generate Explicit Textured 3D（生成显性纹理三维）"的缩写，是一种生成性3D模型，可以合成任何拓扑结构的高质量3D多边形网格。一张二维图像就足以作为生成过程的输入。

图源：Nvidia

生成的多边形网格由带纹理的三角形组成，这是一种标准格式，可以无缝导入3D程序、游戏引擎或电影渲染器。

3D对象在导入后是完全可编辑的，例如，可以进行缩放、旋转和照明。通过英伟达的StyleGAN-Nada，开发人员可以进一步改变3D模型的形状或纹理，只需使用文本命令，例如，将传统汽车转变为警车。

从合成的2D图像生成3D模型

英伟达的研究团队开发了一个两步的生成过程。几何分支生成具有任何所需拓扑结构的多边形网格。纹理分支则会生成一个纹理字段，该字段可以表示颜色，例如，多边形网格表面点处的特定材料。

最后，与GA网络一样，鉴别器根据3D模型的合成照片评估输出的质量，并不断优化它以匹配目标图像。

GET3D是用大约100万张不同角度的3D模型的合成2D图像进行训练的。据英伟达称，在英伟达 A100 GPU上训练需要花费大约2天时间。

GET3D加速了3D内容的进程

GET3D能够生成的3D模型取决于训练数据。例如，如果你用合成的汽车或动物图像训练系统，它可以生成3D汽车或动物。英伟达表示，训练数据集越大、越多样化，生成的3D模型就越详细、越多样化。

图源：Nvidia

据英伟达称，在一个现成的英伟达 GPU上，该模型在训练后每秒可以生成大约20个形状，这些形状组合起来就形成了一个3D模型。生成过程在用户的计算机上进行，因此不受内容限制，如云端人工智能服务中已知的那些限制。

"GET3D使我们离AI驱动3D内容创作的普及化更近了一步，"英伟达在多伦多的研究实验室负责人Sanja Fidler说道，该工具就是在那里开发的。

据英伟达的研究团队称，GET3D的一个限制是，目前只能用已知相机位置的合成图像的2D剪影进行训练。在未来的版本中，相机位置预估的进展可能会成为使用真实图像进行训练的基础。

目前，GET3D也只能按类别进行训练。跨类别的模型可以增加生成的3D模型的种类，提高系统的灵活性。

作为一个开源模型，GET3D可以在Github上免费使用。

来源：mixed-news

投稿/爆料：tougao@youxituoluo.com

稿件/商务合作：六六（微信 13138755620）

加入行业交流群：六六（微信 13138755620）

元宇宙数字产业服务平台

下载「陀螺科技」APP，获取前沿深度元宇宙讯息

上一篇： 第七届金陀螺奖报名优质VR/AR项目：影核-《Creed：荣耀擂台》

下一篇： 美国MPD警局计划实施VR培训，以降低面对精神健康患者的危机情况

你可能感兴趣的文章：

英伟达与Hexagon宣布将在工业数字孪生解决方案方面展开合作

任天堂VR配件新专利曝光，或将搭配新一代Switch推出

英伟达新专利曝光，涉及可用于头显的全息VR显示技术

Nvidia推出Omniverse平台，可远程进行2D/3D多软件实时协作

Nvidia使用LED传感器开发体积小、低成本VR注视点追踪系统

Nvidia将VR技术与自动驾驶结合，展示远程操控无人汽车

热门文章排行: 1 Roblox推出“Metain”测试版，通过与AI聊天开发游戏

2 PS VR2游戏1月下载榜：《Beat Saber》和《Job Simulator》分别占据前两名

3 2025年度备受关注的十大XR技术 | 年度专题

4 搭载OpenAI GPT大模型，DPVR发布新款AI太阳镜G5 Air

5 Multiset AI宣布其定位技术支持智能眼镜，现已兼容Ray-Ban Meta

6 AR联盟宣布新增18个成员，包括TDK和歌尔

7 Sandbox VR第七家加拿大分店即将开业

8 AirPods的摄像头可能意味着支持类似Vision Pro的手势控制

9 全年回顾：2025VR/MR短期回调明显，长期增势不变|年度专题

10 增长250%，年销量突破700万副，AI眼镜的「iPhone」时刻将比预想更快

推荐专题

VR/AR 2025年度专题更多


2025年度备受关注的十大XR技术 | 年度专题
CES2026 更多


30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态
深度 | 全面解读AI眼镜更多


亮亮视野 Leion Hey2 评测：专注语音翻译，用 8 小时真实续航换来的取舍之道
陀螺研究院XR产业报告更多


陀螺研究院发布《2025年度XR大空间产业报告》
苹果Vision Pro开发教程更多


Vision Pro中文开发教程系列视频汇总（全73课）
Vision Pro精选内容推荐更多


Vision Pro精选内容每周推荐：Sandblox、Amplium、Travel Immersive
苹果空间计算专题更多


苹果宣布将为Vision Pro推出首部长篇沉浸式纪录片
硬件专业评测更多


亮亮视野 Leion Hey2 评测：专注语音翻译，用 8 小时真实续航换来的取舍之道
XR行业应用案例集更多


陀螺研究院XR行业应用案例集｜基于穿戴式柔性手部动捕设备的混合现实整形外科手术教学训练一体化平台

人物专访 更多: 对话酷咔数字：Meta震荡期，以《Dread Meridian》向硬核玩家交出「付费体验」答卷 01-23

30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态 01-16

依视路陆逊梯卡：年产能计划提升至2000万副，大量AI眼镜新品正在路上 11-27

对话《夜店模拟器》制作人：从1人开发，到50万下载的实战心得 11-06

对话法国团队VIRTUAL BEINGS：如何用「行为AI引擎」打造跨平台虚拟宠物？ 10-30

不止于大空间：《道诡异仙VR》如何用“实景置景”打通线下沉浸式闭环？ 10-22

对话三体宇宙：故事沉浸、技术突破和线下布局，科幻IP的VR自制之路 10-21

对话英兔软件：穿越VR行业九年周期，1款新品、2条业务线与3个生存法则 09-25

对话灵犀微光郑昱 | Meta新款眼镜选择阵列光波导，这意味着什么？ 09-24

为什么Meta新款AR眼镜使用单目显示？Meta CTO：成本是重要原因 08-20

数据报告 更多: 陀螺研究院发布《2025年度XR大空间产业报告》 01-31

GDC 2026游戏行业现状报告：XR开发者仅占8%，Quest仍为主流平台 01-30

陀螺研究院发布《2025年全球VR/AR行业投融资报告》 01-22

2025年12月VR/AR行业月报丨VR陀螺 01-14

2025年11月VR/AR行业月报丨VR陀螺 12-14

TrendForce：预估2030年LEDoS技术渗透率将达65% 12-01

IDC：2025Q2 AR/VR硬件市场Meta占比超60%，小米增长迅速 11-14

2025年10月VR/AR行业月报丨VR陀螺 11-11

2025年9月VR/AR行业月报丨VR陀螺 10-24

陀螺研究院发布《AI+XR市场国际买家调查报告——渠道篇》 10-20

融资并购 更多: ORamaVR为其医疗XR平台筹集450万美元种子轮融资 02-04

AI运动眼镜企业影辰科技完成Pre-A轮融资，红杉、高瓴参投 02-03

虚拟主播运营商ClaN融资11.5亿日元，将推进其IP全球扩张 02-03

VR跑步机公司Virtuix宣布在纳斯达克上市并获得1100万美元新投资 01-28

3DGS初创公司Nucleus4D获150万美元融资 01-26

一年三轮融资，影目INMO最新C1轮融资透露了哪些信号？ 01-15

瑞典Micro-LED初创公司获超500万欧元融资 01-15

XREAL最新融资1亿美元，公司总估值破10亿美元 01-12

Netflix收购Ready Player Me 12-22

錼创科技并购Lumiode以加速Micro-LED发展 12-22

官方微信账号:
VR陀螺

加入行业社群