文/VR陀螺 冉启行
2026 年,AI 眼镜正在快速迭代,VR/MR 头显的形态也在持续向更轻、更薄演进。
随着硬件门槛的逐步降低,开发者和内容创作者对高质量 3D 资产的需求正在同步提速——无论是 VR/MR 游戏场景、AR 应用还是工业数字孪生,3D 内容的生产效率与质量正在被重新抬上核心议程。然而,传统三维建模的周期长、门槛高、成本难以摊薄,即便是专业团队,也很难用人力跟上内容需求增长的节奏。

visionOS(图源:网络)
在 GDC 2026 前夕,通用人工智能公司 VAST 正式发布了 Tripo P1.0(Smart Mesh),与旗舰模型 Tripo H3.1 相比,它在内容生成上交出了一份完全不同范式的答案。Tripo P1.0 实现了第一次在原生三维空间里做概率生成,不再依赖序列化「拼接」几何,而是在高维噪声场中直接演化出结构完备、拓扑规整的三维网格,最快约 2 秒即可产出可直接进 Unity、UE 等引擎的专业级 3D 资产。
Tripo P1.0 可以看作 AI 3D 大模型算法范式的全新分水岭,它让速度、质量与工程可用性不再是互相牺牲的三难选择,开始同时成立。对 XR 等重 3D 资产的行业来说,这意味着 AI 3D 进一步迈入了商用级规模化的新阶段。

图源:网络
从维度诅咒到原生三维,Smart Mesh做的是底层算法重构
传统 AI 3D 生成模型,在真正碰到可落地这件事时,往往会被维度诅咒卡住。三维空间数据过于庞大、结构过于复杂,模型不得不通过体素网格、体渲染场或点云序列等形式先降维、再线性化处理,再通过一连串后处理把结果勉强还原成可用网格。这类路径在学术论文和 Demo 中看上去可行,但一旦落到游戏、工业或 XR 生产线,问题就会集中爆发——生成速度慢、拓扑脏乱、细节不稳定、引擎兼容性差。
VAST 首席科学家曹炎培对此表示:“过去大家习惯了在 2D 矩阵或 1D 序列上做理解和生成,将处理文字、图像、视频的方法迁移到 3D上,本质上还是在用不适合三维的表示去逼近三维,所以模型在表征层面会非常吃力。因为三维空间本身有它自己的结构特征,比如各向同性、连续性和拓扑约束。严格来说,问题并不在于维度高本身,而在于没有找到三维数据真正合适的底层表征。经典机器学习里也一样,所谓‘维度诅咒’很多时候并不是维度本身不可解,而是你还没有找到它背后的低维流形和本征结构。一旦表征对了,很多原来看起来像诅咒的问题,其实都会被重新改写。比如像我们现在做Tripo P1.0模型这样找到正确的底层表征,这就不再是大问题。”

图生3D模型演示(图源:VR陀螺)
Tripo P1.0(Smart Mesh)的技术路径是绕开了原来的一整套补丁式工程。官方将其定义为一套原生三维生成框架,不是在 2D 投影或隐式体上间接优化,而是让概率生成引擎首次在纯三维坐标空间中直接运行,从一片高维噪声场出发,在空间中逐层「生长」出几何结构。模型不再是按序号逐点预测顶点,而是在统一的三维特征场上,先确定宏观结构,再向局部细节收敛,让复杂空间坐标同步收束成型。
在这个过程中,Smart Mesh 把原本显式编码在规则里的大量几何先验,全部收进了高维潜在空间。每一个顶点不仅仅是一个坐标,而是带着丰富上下文关系的潜在向量,彼此之间的连接关系通过潜在拓扑映射被持续更新与收敛。当概率空间收敛完成,模型直接涌现出一个几何稳定、拓扑严谨、可编辑性良好的网格。

3D模型演示
这种重构带来的直接结果,是模型不再被迫走“慢而精”或“快而糙”的老路,而是在统一的原生三维概率框架下,同时兼顾宏观结构、局部拓扑与细节纹理,为后续所有下游工程环节(减面、骨骼、动画、渲染)预留出最大空间。
百倍推理效率提升,秒级3D模型生成技术
底层重构到底能给前端带来多大改变?我们在 Tripo Studio 中直接上手跑了跑。
输入文本或参考图后,几乎不需要漫长的等待。根据官方披露的数据,Smart Mesh 可以在约 2 秒内生成面数从数百到两万不等、拓扑规整的网格模型。受面数、当前网络环境及云端服务器拥挤程度影响,实际测试体感用时在 10 秒左右。但相比于行业普遍水平,这已经实现了量级的跨越。
曹炎培表示:“我们用比较优雅的数学推导绕过了之前离散组合的暴力算力消耗,这也是为什么之前的方法可能要三五百秒,而我们五六秒就能生成一个网格。背后所需算力被大大减少,不是强行压缩计算量,而是免除了之前方法中因强加因果和排序所带来的不必要计算。”

文生3D模型演示(图源:VR陀螺)
最让我们在意的其实不是速度,而是网格的质量。以往 AI 生成的模型往往伴随着破面和杂乱的边线,但 Smart Mesh 跑出来的低多边形网格,边线清爽、结构合理。
曹炎培对此表示:“我们相当于把拥有多年经验的艺术家才能做出的拓扑布线逻辑,变成了算法上的直觉。普通人通过一张图或一个想法就能瞬间获得一个外观正确、结构符合工业标准的资产,不管是创意设计还是生产力用户,都能回归到意图本身。”

文生3D模型演示,局部重绘调整(图源:VR陀螺)
这种“工业级直觉”早已在实际业务中显现价值。其原有的 H 系列模型在技术与商业化上已稳居行业头部,并深度服务于网易《燕云十六声》、拓竹科技等标杆客户,实现了 3D 打印与游戏 UGC 的大规模产业落地。在原有路线已领跑行业、商业价值全面兑现的背景下,团队依然坚持从底层算法范式进行颠覆式创新。 Smart Mesh 的出现,从某种程度上看,也代表着 VAST 的这家公司底色——极客精神。
从视觉拟真向功能性演进,AI 3D开启UGC互动内容新时代
今年 3 月,VAST 刚宣布完成 5000 万美元的 A 轮融资。据介绍,这笔资金将主要用于 VAST 继续迭代核心算法、积累数据,以及建设 UGC 互动内容平台。
如果说 AI 3D 的 1.0 时代是在追求“看起来真”,那么以 P1.0 为代表的 2.0 时代则是在追求“功能性”。曹炎培表示:“未来很快,大家就会模糊‘3D 建模’的概念。用户会回归到创造 3D 模型的原始意图,而不是纠结于怎么用工具得到它。在当今 AI 时代,VAST 提供的 AI 3D 生成能力是像输入法、摄像头一样的基础能力。”

AR应用演示(图源:AI生成)
在 VAST 的技术版图中,高质量的 3D 资产构成了交互世界中持久性的“状态”,而“世界模型”则负责建模状态之间的“转换”——比如角色怎么和环境交互、交互过程应该怎样自然地呈现和生成。
当下的 XR 产业,高质量内容生产的瓶颈日益凸显。未来的空间计算设备,用户需要的绝不仅仅是几个预先做好的 Demo,而是海量的、个性化的、甚至实时生成的 3D 世界。
曹炎培指出:“当生成一个标准的 3D 交互资产只需要几秒,想象力就会被无限放大,用户不会觉得利用三维资产做想做的事情还有任何障碍。这种 2.0 时代的技术,把之前 1.0 时代速度、质量和可用性的‘不可能三角’变为可能并同时成立。”
通过降低门槛,让不具备专业技能的普通人也能通过自然语言构建交互式内容,VAST 正在尝试定义下一代 UGC 互动平台的基石。在这一轮内容生产逻辑的重构中,行业亟需一个既快、又稳、还能直接接入工业管线的 AI 3D 底座,而 VAST 正试图通过 Smart Mesh 证明,他们就是那个 XR 时代“大基建”的提供方。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
版权申明:本文为VR陀螺原创,任何第三方未经授权不得转载。如需转载请联系微信:vrtuoluo233 申请授权,并在转载时保留转载来源、作者以及原文链接信息,不得擅自更改内容,违规转载法律必究。文中有图片、视频素材来自互联网或无法核实出处,如涉及版权问题,请联系本网站协商处理。
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息