深度报告

推广

行业应用

AI 3D创作来了？“抢饭碗”成真

发布时间：2023-05-04 09:50 | 标签： AI XR 元宇宙 AIGC

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

文/VR陀螺元桥

VR一直都以轻量化内容为主，缺重度内容已久。

重度内容相较于轻量化内容更能满足用户的沉浸式体验，以游戏为例，好的体验感需要大量高精度3D素材，丰富的游戏角色和精美的画面场景，在此基础上增加空间感知与交互、玩法等。

传统的建模方式不仅成本较高而且具备较高的门槛，同时人工建模领域优秀的建模师稀缺，这也使成本再次上升。因此，业内都在寻求高效且低成本的3D内容生成方式。

近期，生成式AI爆火，从AIGC到3D模型，各大公司都开始自研或发布AI 3D创作解决方案。例如腾讯AI Lab提出自研3D虚拟场景自动生成解决方案，帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市，提升3D虚拟场景的生产效率。

生成式AI仅仅依靠一张图片或者输入关键文字就能转化成3D模型，这种惊人的创作很快就让人对这个领域产生了一连串的畅想：AI 3D创作真的要来了吗？内容创作者的饭碗还稳吗？以下将从VR内容制作的两个重要环节：建模与渲染进行分析。

图源：网络

AI 3D建模正加速到来

3D素材是包括游戏、影视、社交等所有3D应用的基石，如果可以通过输入文本快速生成三维模型，3D建模师就可以结合这项技术提高工作的效率，达到降本增效的效果，而海量的3D素材无疑会进一步推动VR的发展。

前面也提到由于人工建模需要花费大量的时间和成本，因此很难满足AR/VR对3D素材的需求。若想推动元宇宙产业快速发展，海量的3D素材少不了，这也是为什么各大企业都在纷纷研发结合AI创建3D建模的技术。

2022年谷歌曾发表过一篇论文《DreamFusion：Text-To-3D Using 2D Diffusion》，详细概述了“DreamFusion”。简单来看，“DreamFusion”是先使用一个预训练2D扩散模型（如Imagen）基于文本提示生成多个视角的3D视图，再依据NeRF（神经辐射场）重建。

NeRF与Imagen互相影响，没有一个训练得比较好的NeRF，Imagen很难生成连贯的多视角图；反之，就得不到好的NeRF。于是作者提出NeRF和Imagen来回迭代的方法。这种来回迭代有个缺陷是耗时，如来回迭代15000次，生成一个模型就需要在4块TPUv4上训练1.5小时。

图：3DNeRF和2D生成模型来回迭代优化（来源：dreamfusion3d）

目前很多三维方法都是基于NeRF所生成的，这种方式生成的三维物体在效率、渲染、质量上都有显著的提升，但现阶段还不能做结构数据，也就是Mesh，无法用来开发VR重度内容。关于NeRF（神经辐射场）详细介绍，可以参阅VR陀螺近期文章《高效低成本构建元宇宙场景：NeRF神经辐射场》

图源：网络

2022年，英伟达也发表了一篇关于《Magic3D：High-Resolution Text-to-3D Content Creation》的论文。文中阐述了生成式AI如何无需特殊培训也可创建3D模型的过程。

随着近期AIGC的爆火，Magic3D在业内得到了极大的关注。也正因为看到Magic3D建模的效果，业内人士普遍认为AI 3D创作真的要来了。

Magic3D将重建过程分成了两部分，一是先使用低分辨率创建粗略的模型，到第二阶段从粗神经表示初始化的纹理网格模型，使用与高分辨率潜在扩散模型交互的高效可微的光栅化渲染器进行优化。类似于DreamFusion使用文本到生成2D图像，然后基于NeRF创建3D模型一般。

图：Magic3D的两阶段优化过程示意图（来源：网络）

Magic3D还可以根据给定主题实例输入图像，使用DreamBooth微调扩散模型，并使用给定的提示优化3D模型。

图：在给定主题下根据提示进行模型优化（来源：网络）

同时，只需要40分钟左右，Magic3D就可以创建一个带有彩色纹理的3D网格模型，相比DreamFusion快了2倍。

目前DreamFusion和Magic3D尚未开源，同时也未达到商业化的成熟度。AI创作对数据、算法有着极高的要求，而3D数据又具有天然的稀缺性，难收集等特点，即便有了庞大的数据，AI如何从庞大的数据中学习创作也是一个问题；而从2D直接扩展到3D，也需要极大的计算量，如何加快优化速度，如何撰写正确的脚本都是需要解决的算法问题。

此外，AI 3D创作在落地场景、可行性的商业化路径、技术风险等方面都尚无法达到工业化的生产标准，甚至还有很长一段路要走，据业内预估可能五年或长达十年之久。但可以看到的是ChatGPT已经可以根据一段文字描述进行编码生成脚本，而GPT-5大模型也在筹备中了，就像互相迭代一样，通过不断地反馈更改，AI会变得越来越智能，所生成的编码会逐步优化升级，达到初步使用的需求。

一旦生成式AI的3D创作技术成熟，就可以加速VR游戏、视频以及应用程序的开发。届时，或将会解决VR海量内容需求的一大痛点。

AI实时渲染：技术仍有限

除了建模，VR内容制作另一个重要环节便是渲染了。渲染对用户体验有直接的影响，一般在AR/VR场景中，为了能够实现灵活的交互方式和丰富的感官体验，需要在内容生产中提升配套的实时渲染能力。

相对于传统的非实时渲染，实时渲染所见即所得，能够更加直观地看到输出效果，方便制作人员进行调整。目前，人工智能已经开始在实时运算渲染领域初显本领了。

近期，海外一款名为ArkoAI的人工智能渲染器在设计创作领域得到了极大关注，以插件形式安装在SketchUp、Rhino、Revit中。

使用者只需要输入关键词，仅几秒就可以渲染出较好的效果图；同时还可以将模型置于不同的场景中，即便是简单的几何形体也能渲染出效果图。

图源：网络

ArkoAI的初衷是简化设计师繁琐的工作流程，但目前还只是一个简单的AI生成器，生成的图片大部分是关于建筑和室内领域；同时，渲染水平也停留在比较初级的阶段，对建筑风格和结构的理解非常有限。前面也提到AI的核心是算法和数据，在渲染层面亦是如此。

目前AI渲染还达不到真正的使用需求，同时在多次输入相同关键词的情况下，渲染的图会逐渐变得模糊甚至走形，AI的“智能”程度仍然有限。

虽然还不能切入VR内容的创作层面，但是这个风向标却越来越清晰了。

图源：网络

在GTC 2023大会上，英伟达也针对AI视频、图像生成、大型语言模型、图形渲染等推出了NVIDIA L40，旨在利用AI加速渲染，基于数据和神经网络训练方法形成的自动化的材质生产链路，具有高度还原离线材质、速度快、且能够快速迭代的优势。

图源：网络

此外，如前面提到的英伟达Magic3D也可以从文字描述中渲染出彩色纹理的3D网格模型，例如最近比较火的“一只坐在睡莲上的蓝色毒镖蛙”。

图：Magic3D 渲染的箭毒蛙 3D 模型（来源：网络）

Meta、微软、谷歌等企业也都在投资实时3D渲染，在未来数年里，无论是AI渲染还是AI建模的技术都会比现在进化的更好，无疑会给3D创作带来巨大的进步，也将会使创作环节变得更快、制作成本更低。

AI的触角在3D创作设计领域延伸的越来越深，甚至日本已经有企业开始采用AI作画实现商业化运行了。从AI到AI 3D建模再到实时渲染，我们正在经历“技术改变创作领域甚至一切设计工作”这一场景。随着研发深入，未来创作者直接输入会变得更少，3D素材呈现巨量增长的态势。

AI抢工作成定局？

图源：网络

在人工智能普遍成为各行各业的底层技术背景下，大家都在思考AI还能做什么？我们的工作是不是正在面临被淘汰的局面？不仅在科技领域，传统行业如律师、编辑等都发出了相似的感叹。甚至也有机构作出细化分析，哪些职位未来不会被取代。一夜之间，所有人对AI的恐慌好像都上了一个层次。

其实AI创作会不会真的抢人类的“饭碗”得就具体岗位而论，就像工业4.0大潮中替代一线工人的机器人一样，甚至有些工厂已经实现了全自动化运行，大量不需要创意、简单且重复性的劳动已经被替代。

本轮AI的大潮与工业4.0的本质区别在于“智能化”，AI已经展现出“创作”的能力，即使目前的创意还能看到诸多样本的痕迹，建模和渲染的AIGC能力也还处于早期，但AI在部分领域能提升生产力已经成为不争的事实。

与其担心自己的工作是否会被AI替代，不如思考如何结合AI将现有的工作更完美地完成，如何让AI变得更好，因为被错误的大数据喂养，扭曲AI的认知，那时AI做的事情可能会超越人类的底线。

《失控》的作者凯文·凯利认为“未来将有数以万计创业公司，他们会从事人工智能用于某一个领域的工作。使用者越来越多的话，机器会越来越聪明，这是一种滚雪球的方式。”

也就是说技术进步是必然的，同时由于基础数据不断扩大，机器的思维方式会变得越来越灵活。但技术给社会带来的变革，并不是以抢工作为最终目标，而是成为一种提升效率的生产方式。

图源：网络

凯文·凯利也曾在一次演讲中表示，每一项新技术的诞生都会引发一场恐慌周期，一般会经历7个阶段：

别让我看到这些垃圾，根本没用。
好吧，这东西确实发生了，但是很危险，因为效果并不好。
等等，它太好用了，我们必须得做点什么扰乱它！
这东西太强大了，对于那些无法触达它的人来说是不公平的。
现在它无处不在，无法逃离，这不公平。
我打算戒掉它，戒一个月。
让我们关注真正重要的问题ーー下一个会出现的技术是什么？

其实大多数人对新技术持负面态度多源于对技术的不了解，当人们不了解一样产品的时候，往往会持有不看好的态度。但细究下来会发现技术做的事情只是在让原有东西变得更加智能，例如AI辅助飞机驾驶，飞行员只要做好基础的操作，剩下的都是AI在驾驶飞机，可以有效缓解飞行员一路的疲劳与提高飞行安全程度。

因此，AI 3D的创作也并不会真正取代建模师以及渲染师的工作，反而可以多维度地给建模师提供多重视角，也让建模师可以从繁琐的工作中简化出来，做更有意义的事情。但我们总会抱着戏谑的态度看待AI，以古怪刁钻的问题去调戏AI，从而给人工智能定义上“人工智障”的名号。

顺理成章的把AI看作人类的对立面，也理所应当的不会乐于接受新技术的到来。马斯克曾说过一句话，无论你接受与不接受，无论人类如何呼吁停止采用新技术，总会有企业在马不停蹄地研究，在你不知道的地方，不知道的领域，它会在某一天就来了。

与此同时，毋庸置疑的是人工智能在某一方面已经开始比人类聪明了，甚至可以跨专业地协同工作。但由于机器与人类的思考方式不同，机器变得越聪明时反而会推动人类工作的进步。此外，技术的进步也会创造出新的工作，改变就业的生态格局，人+AI将是未来任何工作领域的一个普遍现象。

参考文献

元宇宙时代超高清视音频技术白皮书
凯文凯利：AI将改变一切设计工作https://www.wired.com/story/picture-limitless-creativity-ai-image-generators/
https://research.nvidia.com/labs/dir/magic3d/
Taichi NeRF (下): 关于 3D AIGC 的务实探讨

投稿/爆料：tougao@youxituoluo.com

稿件/商务合作：林南（微信 19250561593）六六（微信 13138755620）

加入行业交流群：林南（微信 19250561593）

元宇宙数字产业服务平台

下载「陀螺科技」APP，获取前沿深度元宇宙讯息

上一篇： 美国医疗保险和医疗补助服务中心为VR设备创建二级HCPCS代码

下一篇： 苹果新专利曝光，或将为下一代汽车推出AR显示系统

你可能感兴趣的文章：

2026年第二十三届ChinaJoy定档7月31日，“与AI同游”引领全球数字娱乐新风向

中国移动董事长陈忠岳：移动智能，无界普惠

聚焦AI变现！香港大型商业AI盛会AI+Power展览及论坛6月4-5日举办

商业AI规模化时代降临！ AI+ Power 6月4-5日揭幕：解构「转化利润」实战攻略

Token工厂智启未来，2026智算基础设施创新大会在杭州萧山开幕

新加坡SIT推出AI+VR技能评估工具

推广

热门文章排行: 1 58° FOV、骁龙8 Elite Gen 5，AIOS，一文看懂 Rokid Open Day 2026

2 传Snap拟1亿美元股权签约小罗伯特·唐尼，为Specs代言

3 受内存存储成本上涨影响，苹果M5 Vision Pro售价上调200美元

4 《Ghosts Of Tabor》开发商Combat Waffle Studios宣布裁员

5 Innovative Eyewear携手Encore Optical，拓展Lucyd AI眼镜配镜服务

6 雷鸟iO首秀：单绿色显示方案，搭配波士顿框设计

7 理湃光晶完成B+++轮融资，加速建设百万套级AR光学组件生产基地

8 单眼4K、AI Agent几小时搭出3D应用，PICO Swan再曝底牌

9 苹果公司Vision Pro和AI眼镜项目负责人跳槽至OpenAI

10 AltaVR宣布VR游戏《小镇传奇》将于7月停服

推荐专题

VR/AR 2025年度专题更多


2025年度备受关注的十大XR技术 | 年度专题
CES2026 更多


30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态
深度 | 全面解读AI眼镜更多


下一代 AI 眼镜正在「悄悄」涨价
陀螺研究院XR产业报告更多


9款新品，近6亿融资，《2026年5月VR/AR与AI眼镜行业月报》发布
苹果Vision Pro开发教程更多


Vision Pro中文开发教程系列视频汇总（全73课）
Vision Pro精选内容推荐更多


Vision Pro精选内容每周推荐：Sandblox、Amplium、Travel Immersive
苹果空间计算专题更多


苹果宣布将为Vision Pro推出首部长篇沉浸式纪录片
硬件专业评测更多


亮亮视野 Leion Hey2 评测：专注语音翻译，用 8 小时真实续航换来的取舍之道
XR行业应用案例集更多


陀螺研究院XR行业应用案例集｜基于穿戴式柔性手部动捕设备的混合现实整形外科手术教学训练一体化平台

人物专访 更多: 对话Arvore创始人：打造《黑袍纠察队》VR大作，巴西工作室冲刺3A与多平台布局 06-04

对话酷咔数字：Meta震荡期，以《Dread Meridian》向硬核玩家交出「付费体验」答卷 01-23

30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态 01-16

依视路陆逊梯卡：年产能计划提升至2000万副，大量AI眼镜新品正在路上 11-27

对话《夜店模拟器》制作人：从1人开发，到50万下载的实战心得 11-06

对话法国团队VIRTUAL BEINGS：如何用「行为AI引擎」打造跨平台虚拟宠物？ 10-30

不止于大空间：《道诡异仙VR》如何用“实景置景”打通线下沉浸式闭环？ 10-22

对话三体宇宙：故事沉浸、技术突破和线下布局，科幻IP的VR自制之路 10-21

对话英兔软件：穿越VR行业九年周期，1款新品、2条业务线与3个生存法则 09-25

对话灵犀微光郑昱 | Meta新款眼镜选择阵列光波导，这意味着什么？ 09-24

数据报告 更多: 9款新品，近6亿融资，《2026年5月VR/AR与AI眼镜行业月报》发布 06-11

AI眼镜大战升级，40家核心芯片厂商一览｜2026年最新产业图谱 05-25

VR游戏周报丨Valve公布4月SteamVR硬件数据；Quest月活超百万游戏《Animal Company》登陆Steam 05-22

22家！AI眼镜传感器厂商一览｜2026年最新产业图谱 05-15

2026年4月VR/AR行业月报丨VR陀螺 05-12

2026年3月VR/AR行业月报丨VR陀螺 04-13

陀螺研究院发布《2025全球VR/AR产业发展报告》 04-01

2026年2月VR/AR行业月报丨VR陀螺 03-11

洛图科技：2025年中国智能眼镜市场销量145.4万台 03-05

陀螺研究院发布《2025年度XR大空间产业报告》 01-31

融资并购 更多: VAST完成超10亿元人民币A3战略轮融资，持续深耕AI 3D大模型与世界模型赛道 07-02

索尼影业向VR线下体验馆运营商Cosm注资1亿美元，并获少数股权 06-25

创想数维完成2010万元Pre-A+轮融资，加速AI+XR产业化落地 06-03

IPO前夜，Rokid狂飙 06-03

VTuber应用《Avvy》的运营商AnotherBall宣布获得25亿日元债务融资 05-20

韶音、光峰参投，主打“智能变焦眼镜”的众见科技完成数千万元融资 05-18

Phosio获400万美元融资，将用于投建低成本高性能AI眼镜镜片生产线 05-14

VR医疗创企Floreo获克利夫兰诊所100万美元投资，其VR自闭症疗法将接受美国FDA审评 04-21

德国VR心理健康技术创企brainjo完成200万欧元种子轮融资 04-21

AR光学方案商「鲲游光电」完成近4亿元C+轮融资 04-10

官方微信账号:
VR陀螺

深度报告

行业应用

你可能感兴趣的文章：

2026年第二十三届ChinaJoy定档7月31日，“与AI同游”引领全球数字娱乐新风向

中国移动董事长陈忠岳：移动智能，无界普惠

聚焦AI变现！香港大型商业AI盛会AI+Power展览及论坛6月4-5日举办

商业AI规模化时代降临！ AI+ Power 6月4-5日揭幕：解构「转化利润」实战攻略

Token工厂智启未来，2026智算基础设施创新大会在杭州萧山开幕

新加坡SIT推出AI+VR技能评估工具

热门文章排行

推荐专题

人物专访

数据报告

融资并购