微信公众号

VR陀螺微信公众号

手机端

手机端扫码访问

深度报告

推广

推广

推广

推广

AI

英伟达发布开源世界模型“SANA-WM”，可单图生成一分钟的720p视频

发布时间：2026-05-25 11:55 | 标签：英伟达世界模型 SANA-WM SANA

转载来源：moguravr

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

编译/VR陀螺

NVIDIA的研究团队于2026年5月14日发布了关于开源世界模型“SANA-WM”的论文。所谓世界模型，是指通过学习现实空间中的物理运动和深度信息，并据此生成图像的人工智能模型。SANA-WM也被视为具身智能、机器人训练、游戏原型开发、VR/AR内容创作和影视预可视化等领域的研究新基准。

在SANA-WM中，只需输入一张静态图像和摄像机的移动路径，即可生成60秒、720p分辨率的高保真可控视频。摄像机的运动可通过6DoF进行控制。除了上下左右的移动外，还可以指定平移、俯仰等旋转方向的运动，因此可以输出仿佛在实际移动中拍摄的影像。

演示页面上公开了雪山小径、水下遗迹、沙漠科幻废墟等多种场景的样片。此外，这些演示视频是通过结合2.6B参数，且整个推理过程可在单张H100 GPU上高效完成。

在技术层面，据称该模型在实现36倍于现有开源模型的吞吐量（指系统或设备每单位时间可处理的“实际数据量”或“作业处理能力”）的同时，还达到了与LingBot-World和HY-WorldPlay等闭源产品相当的视频质量。

仅使用约21.3万条带度量尺度姿态标注的公开视频片段，在64张H100上训练15天即可完成。标准推理可在单块H100上运行。若对蒸馏版应用NVFP4量化技术，即使使用RTX 5090，也能将60秒的720p视频生成时间缩短至34秒。

来源：moguravr

投稿/爆料：tougao@youxituoluo.com

稿件/商务合作：林南（微信 19250561593）六六（微信 13138755620）

加入行业交流群：林南（微信 19250561593）

元宇宙数字产业服务平台

下载「陀螺科技」APP，获取前沿深度元宇宙讯息

上一篇： Meta正式进军韩国，加速布局亚洲AI眼镜市场

下一篇： 第34届雨舞影展沉浸式单元作品公布

你可能感兴趣的文章：

Clear XR将Apple Vision Pro眼动追踪串流技术引入OpenXR PC VR游戏

Memories AI正在为可穿戴设备和机器人构建视觉记忆层

【GDC 2026】GeForce Now体验大升级，VR串流迈入90帧时代

OpenAI获1100亿美元巨额融资

达索系统与英伟达宣布将合作打造AI虚拟孪生平台

CES2026｜三方硬核联动！VITURE联合英伟达、斯坦福展示XR+AI生命科学重大突破

热门文章排行: 1 90亿元涌入，资本重仓 AI 眼镜和“卖铲人”｜2026年中特辑

2 苹果新专利：未来AI眼镜或将搭载自适应贴合系统，以解决佩戴滑落难题

3 谷东智能PVG光波导实现单基板45°FOV，用单层方案破解双层量产痛点

4 6月SteamVR数据：PC VR用户占比下滑，Pico 4、PS VR2逆势上涨

5 PICO 3Dmaker迎来重磅更新，2D转3D算法全面升级

6 腾景科技拟出资3500万元设立昆山子公司，整合AR消费类光学业务

7 Meta为智能眼镜推出Instagram专属创作功能，强化第一人称内容分享体验

8 西班牙3-0奥地利晋级世界杯十六强，门将PICO头显训练法引发关注

9 逸文科技完成1.5亿美元Pre-B轮融资，投后估值超10亿美元

10 17款新品，近55亿融资，《2026年6月VR/AR与AI眼镜行业月报》发布

推荐专题

VR/AR 2025年度专题更多


2025年度备受关注的十大XR技术 | 年度专题
CES2026 更多


30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态
深度 | 全面解读AI眼镜更多


下一代 AI 眼镜正在「悄悄」涨价
陀螺研究院XR产业报告更多


17款新品，近55亿融资，《2026年6月VR/AR与AI眼镜行业月报》发布
苹果Vision Pro开发教程更多


Vision Pro中文开发教程系列视频汇总（全73课）
Vision Pro精选内容推荐更多


Vision Pro精选内容每周推荐：Sandblox、Amplium、Travel Immersive
苹果空间计算专题更多


苹果宣布将为Vision Pro推出首部长篇沉浸式纪录片
硬件专业评测更多


亮亮视野 Leion Hey2 评测：专注语音翻译，用 8 小时真实续航换来的取舍之道
XR行业应用案例集更多


陀螺研究院XR行业应用案例集｜基于穿戴式柔性手部动捕设备的混合现实整形外科手术教学训练一体化平台

人物专访 更多: 对话Arvore创始人：打造《黑袍纠察队》VR大作，巴西工作室冲刺3A与多平台布局 06-04

对话酷咔数字：Meta震荡期，以《Dread Meridian》向硬核玩家交出「付费体验」答卷 01-23

30克只是起点：瑞声科技谈AR眼镜的重量、功能与未来形态 01-16

依视路陆逊梯卡：年产能计划提升至2000万副，大量AI眼镜新品正在路上 11-27

对话《夜店模拟器》制作人：从1人开发，到50万下载的实战心得 11-06

对话法国团队VIRTUAL BEINGS：如何用「行为AI引擎」打造跨平台虚拟宠物？ 10-30

不止于大空间：《道诡异仙VR》如何用“实景置景”打通线下沉浸式闭环？ 10-22

对话三体宇宙：故事沉浸、技术突破和线下布局，科幻IP的VR自制之路 10-21

对话英兔软件：穿越VR行业九年周期，1款新品、2条业务线与3个生存法则 09-25

对话灵犀微光郑昱 | Meta新款眼镜选择阵列光波导，这意味着什么？ 09-24

数据报告 更多: 17款新品，近55亿融资，《2026年6月VR/AR与AI眼镜行业月报》发布 07-09

9款新品，近6亿融资，《2026年5月VR/AR与AI眼镜行业月报》发布 06-11

AI眼镜大战升级，40家核心芯片厂商一览｜2026年最新产业图谱 05-25

VR游戏周报丨Valve公布4月SteamVR硬件数据；Quest月活超百万游戏《Animal Company》登陆Steam 05-22

22家！AI眼镜传感器厂商一览｜2026年最新产业图谱 05-15

2026年4月VR/AR行业月报丨VR陀螺 05-12

2026年3月VR/AR行业月报丨VR陀螺 04-13

陀螺研究院发布《2025全球VR/AR产业发展报告》 04-01

2026年2月VR/AR行业月报丨VR陀螺 03-11

洛图科技：2025年中国智能眼镜市场销量145.4万台 03-05

融资并购 更多: VAST完成超10亿元人民币A3战略轮融资，持续深耕AI 3D大模型与世界模型赛道 07-02

索尼影业向VR线下体验馆运营商Cosm注资1亿美元，并获少数股权 06-25

创想数维完成2010万元Pre-A+轮融资，加速AI+XR产业化落地 06-03

IPO前夜，Rokid狂飙 06-03

VTuber应用《Avvy》的运营商AnotherBall宣布获得25亿日元债务融资 05-20

韶音、光峰参投，主打“智能变焦眼镜”的众见科技完成数千万元融资 05-18

Phosio获400万美元融资，将用于投建低成本高性能AI眼镜镜片生产线 05-14

VR医疗创企Floreo获克利夫兰诊所100万美元投资，其VR自闭症疗法将接受美国FDA审评 04-21

德国VR心理健康技术创企brainjo完成200万欧元种子轮融资 04-21

AR光学方案商「鲲游光电」完成近4亿元C+轮融资 04-10

官方微信账号:
VR陀螺

加入行业社群