文/ VR陀螺 灵火
4月15日,华为在上海举办了“身临其境,看见美好”VR音乐媒体品鉴会。郎朗首部VR音乐作品正式上线华为视频VR专区和华为VR视频。除了郎朗的三部作品,华为VR音乐平台还通过与更多独立音乐人、乐队的合作引入高质量的VR音视频内容。官方透露,平台首发阵容将达到24部作品。
沟通会当天,陀螺君受邀来到现场。亲身体验了目前已经上线华为VR视频的八部作品,并对华为VR音视频生态平台提供的端到端VR技术解决方案有了深入了解,也充分理解了拍摄强沉浸感VR音乐会背后所需要的科技硬实力。
此外,陀螺君还深度对话华为消费者业务云服务副总裁谭东晖、华为VR音视频平台总监Xinxin。透过他们的分享,了解到关于华为VR音视频一站式生态服务在前端播放能力、视频点播VOD服务、音乐开发工具及VR内容的制作与发行等更多方面的技术沉淀及实用价值。
VR音视频,华为笃定的5G时代新应用
5G技术的快速发展,使得千行百业有了一个具备创新基础的技术平台。5G技术在中国商业化落地的两年时间里,其发展速度远超想象。
同样是这个时间节点,3G技术部署后的一年时间里,全球商用网络只有9个,3G站点数仅有2万个,用户数32万;4G技术时代略强。相较之下,5G技术正式部署的第一年里,全球5G商用网络数已经超过110多个,站点数80万个,用户数超过2亿。
这背后,在于人们对超大带宽应用、超低延时应用以及海量联接式应用的庞大需求。谭东晖表示:“在超大宽带应用需求下,华为意识到VR/AR、超高清视频和无线传影等新科技融合5G商用将催生出第一波改变人们生活、办公和娱乐方式的产业。”
华为消费者业务云服务副总裁谭东晖
也就是说,华为相信VR音视频将成为5G技术普及下的第一波深度影响用户行为的产业。那么,为何会如此笃定呢?
业界的技术成熟度曲线认为,一项技术需要经过萌芽期、炒作巅峰期、低谷期、平稳发展期以及成熟期。2018年以后,VR技术被从这条曲线上移除,这意味着其发展状态已开始趋于成熟;而看结果,2020年,全球VR头戴式显示器的出货量达到670万台,相比于2019年增长了72%,几乎翻番。
谭东晖认为,技术的不断成熟与其VR设备出货量的不断增长,足够证明VR技术已经跨越了低谷期,进入到规模应用成熟期,这意味着VR已经开始接近我们的生活,VR产业的未来充满无限想象。
与此同时,人们对于在线服务及影音的需求也在大幅增长。2020年,人们通过移动设备观看在线视频的时长增长40%,在音乐领域,全球流媒体收入占增长19.9%,成为全球录制音乐产业中唯一的收入增长来源。
“人们对于音乐的需求,将不再仅限于如今的便携性和丰富性,将很快向着更创新的用户体验和更优质的创作内容提出更多要求。希望在线上,就能够体验到过去在线下音乐会才有的几倍或者十几倍的临场感。”
华为终端云服务已经为全球7亿多消费者提供全场景、高品质的数字服务。这样的背景之下,正因看到这样的用户需求,本着以消费者为中心,打造软硬件双轮驱动的全场景智慧生态(1+8+N和HMS)理念,正式上线了华为VR音视频平台。
13K拍摄、空间音频,华为VR音视频方案如何做到低成本高质量?
华为VR音视频平台是华为终端云服务推出的全新内容平台,其作用是在全球范围内连接音乐人、音乐创作者,令用户随时随地能够体验到由超高清画质、空间音频等技术支撑的优质VR音视频内容。
用户可以通过VR Glass头显或者华为手机体验华为视频VR专区中的所有内容。而支撑该平台的是一整套内容制作解决方案。
华为VR音视频平台涵盖了前期制作、后期合成、编解码适配和上架发行平台四个标准流程,其方案涉及前端播放能力、视频点播VOD服务、音乐开发工具及VR内容的制作与发行各阶段,实现了端到端一体化全覆盖。
整体来看,该方案优势可以大致分成三类:
1、超高清画质呈现
顾名思义,VR的音视频体验最主要的就是内容视觉和听觉上的感受。提到视觉部分,很多人对于VR的第一印象是不够清晰、纱窗效应严重。成像质量方面,在对比度高的高光区域成像,是多数拍摄设备所遇到的老大难问题。
在VR里面的成像和传统意义上的影视内容拍摄不同。人眼在沉浸式数字环境下会追求更加接近人眼的成像效果,这种高要求很多平面视频拍摄设备都难以企及,而VR需要考虑的是360度范围内的画面质量输出,无疑难度更大。
在上图中,左侧和右侧分别放置的是华为VR音视频内容制作解决方案中录制设备在高对比度和暗光环境下的拍摄效果。可以看到,其对于曝光、噪点处理的相对柔和自然,衣衫之上花纹的呈现细节丰富。
Xinxin认为,无论是1080P、4K还是8K分辨率,其实这只是视频成像质量衡量中的一个维度,它并不是全部。一个视频的好与坏,固然跟尺寸有一定的关联,但更重要的是像素的质量、锐度,包括色彩范围以及帧率,这些是会深深影响视频观看质量的关键技术点。
“从这两张图可以看出,华为对于VR视频成像的理解,并非传统意义上的仅是尺寸上的优势,而是基于对VR类影像的采集和回放技术的深刻理解。”
2、3D空间音乐效果
目前的VR内容(尤其视频)体验里面,有时候会有提及一些跟3D声音有关的描述,但并未对此有更为深入的研究和认知。
将双手比作声源,当用户戴上耳机的时候,传统的立体声音效是从耳机两侧进行发声。用户在转动头部的时候,音源被固定在头颅两侧,这证明传统声音模拟并不包含声音的空间信息和它的三维空间的位置信息。
所谓实时3D现场声音,即3D空间音乐效果可以还原声音的方位信息、声场信息和环境信息,可以把不同的相位音源同时在算法中进行处理并提供给用户。这与5.1、7.1影音设备不同,除了设备体积差距外,因为配备数量有限,这类设备无法模拟真正意义上360度音效,且成本及操作难度都远高于前者。
在上图中,是华为VR音视频内容制作解决方案现场录制时的声道图解。设备将现场声音全部解析成了单独的通道,提供给用户去听,而传统的立体声只有双声道概念。举个例子,现场歌手的声音会由其本人、乐器、音响设备等发出,因此至少有四路声音被记录和采集的,这在传统方案中只能是揉在一起。
华为VR有专属的编解码音频信号解析的标准,与市面上的无损和标准编解码信号相对比,前者音频信号的解析在网络带宽的压力下并没有损失音质(上访的点状物数量区分)。这是因为华为增强层编解码信号允许在体积更小的情况下,传递跟原始无损信号更一致的音频音质给到用户。
3、VR编辑工具
华为VR音视频内容制作软件可以实现原有录制文件的整合、打包和输出。整个文件打包的流程非常傻瓜,其基于传统行业的录音师和后期音视频制作的流程,可实现时间线编辑、素材管理方式、动画记录方式等声音的轨迹和画面的特性一同在该软件里完成编辑。
此外,导出的完成版文件可以被华为VR音视频平台所识别,并实现自动上传和云端全球分发。
据介绍,华为VR音视频内容制作软件相较业内大幅降低了VR音视频内容制作的成本。一部作品的制作成本可以压到同行业内的1/10,并保证其视听质量达到最佳。
通常的制作成本是指人力成本和现场部分(场地、灯光、舞美、录回音等)素材采集方面的成本。华为的拍摄设备及后期制作工具引入自动化操作方案,极大程度节省了人力成本和现场操作的成本。
Xinxin称,通常情况下华为的一部作品只需几个小时就可以完成拍摄。对比传统的作品录制流程,华为VR音视频采集系统的展开和收集效率更高。此外,后期阶段里,华为将优势项的音频处理能力和视频处理能力工具化,这样就省去了以前分散在多个工具端处理完后再缝合到一起的过程,这会减少内容的生产成本和时间。
未来,华为将运用通讯业起家的编解码标准制定优势,更加大力推动VR音视频工具的标准化。并基于类似音乐Party模式(允许多台华为手机拼合实现类似多点采集收音的效果)等功能,进一步降低VR音视频内容的录制阶段硬件成本。
实测:空间级感官拔升,这次真不是纯堆技术
会议之后,陀螺君实际体验了华为VR视频中现已上线的8款VR音视频内容。下面我以两款极具代表性的内容实际体验为例,来分享下对于所谓华为VR音视频黑科技的切实感受。
1、《茉莉花》(郎朗)
第一次体验,是朗朗的钢琴曲独奏茉莉花。这部作品采用类似沙龙演奏的形式,很多观赏者围坐在郎朗及钢琴周围。美妙的琴声呼之欲出,而身为观赏者里的一员,陀螺君则恰好坐在郎朗的正侧面,属于黄金观赏位。
这部作品的背景,模拟了类似漆黑环境聚光灯下的画面效果。郎朗和众人在灯光之下,与漆黑深邃的背景区分开来。值得一提的是,陀螺君可以清楚地看到光照下每位观赏者的毛孔,郎朗戴着的手套上的纤维和钢琴背光板折射出的倒影。
在这种极度考验设备处理曝光环境拍摄能力的环境下,陀螺君看到的不是一片漆黑或者惨白一片,而是在灯光照应下,人们的背影和细枝末节的微表情。而工作人员告诉陀螺君,虽说观赏细腻度已经非常震撼,但其实原片分辨率可以达到13K*9K,而目前的影片只是达到了4K级别。可以想象,如果真有头显可以原生支持13K的片源,那会是一番更加难忘的体验,并且该片源也支持适应未来3-5年的发展。
2、《BeatBox Show》(啊鑫)
如果说郎朗给我的第一印象是视觉爆炸,那这段B-BOX就是真正的听觉爆炸。视频开始,啊鑫随即开始自己的表演。我面对着啊鑫,距离只有一拳之隔。随着嘴唇的抖动,一阵阵爆炸似的声波传入陀螺君的耳膜,从声音来分辨,即使是闭着眼睛甚至脑海里都可以精确浮现处他在发声时的嘴型。
而这,还不是最有趣的。
因为现场是坐在一把类似蛋椅的旋转座椅中。因此,陀螺君下意识扭转身体,头部便跟着向左侧旋转。此时我不再正对啊鑫,而是左耳正对的侧身方式。陀螺君明显感觉到音场强度的变化,就好像真的在视频内容中转了个身一样。与之类似的,左转、右转音源变化感知最为明显,抬头、低头则可以感受到声音轻微发闷。
这就是所谓华为3D空间音效,实际体验后陀螺君发现——其实它实现的就是一句话:让用户走进内容。正如Xinxin所说,沉浸式体验是令用户走进内容的最佳方式。
而据透露,华为已经在VR光场拍摄技术方面研究多年,并会随着用户群体的增加,考虑将最新的交互模式(比如语音识别、弹幕交互、眼球追踪等)加入其中。现在,还只是视听维度更上一层楼。也许不久的将来,我们真的可以走到郎朗面前,请他喝杯茉莉花茶;亦或是摆个炫酷的姿势,和对面啊鑫来一场battle(即6DOF交互)。
总结
究竟什么才是适合中国VR消费级市场的产品?
Xinxin说:“VR产业发展,从来缺的不是技术的更替和成熟,而是真正能够将新技术带入旧领域,催生新用户的人。在VR音视频这块,我们愿意投身其中,因为有调研后实实在在的用户需求、有华为的技术优势作为支撑,那何乐而不为呢?”
未来,华为VR音视频内容制作解决方案或将对外开放,这意味着未来任何一个普通人、up主或者作曲人,都有机会成为VR音视频作品的缔造者。谭东晖称,以用户为导向,不断创新、发展和探索正是一直以来华为发展的愿景。我们希望华为VR音视频平台可以开个好头,并随着用户群体的重视度增加,逐渐进行外扩。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息