编译/VR陀螺
近日,美国专利商标局发布了苹果的一项专利申请,该专利申请涉及在未来iPhone中使用3D音频技术进行立体音视频录制。
从总体上看,苹果公司的专利申请20200137489标题为“用于立体声视频录制的空间偏置拾音器”,涵盖了音频的立体声录制,该录制有助于实现完整3D声音的捕获,换句话说,它能够重现准确的声音场景并给用户一种身临其境的感觉。
苹果公司声明,可以使用头部相关传输函数(HRTF)通过对音频输入进行空间渲染来实现完整的3D声音捕获,该功能会修改声音信号,以使听众感知到声音信号源自空间中的任何点。
通过该技术,完整的虚拟现实应用程序可以让用户在虚拟环境中进行视觉和听觉交互,但在传统的视频捕获应用程序中,三维声音只能使观看者从屏幕上分散注意力,而单声道或传统立体声录音可能无法提供足够的沉浸感。
苹果的发明涵盖了一种用于产生空间偏置的拾音器波束成形功能的方法,该方法将应用于视频记录的多通道音频记录。该方法包括生成目标方向性函数,包括一组与空间偏置的头部相关的传递函数。
可以通过基于设备控制矩阵确定对目标方向性函数的最佳拟合,来生成波束成形系数的左耳组和右耳组,然后可以输出波束成形系数的左耳组和右耳组并将其应用于多声道音频记录,以产生更具沉浸感和空间偏向的音频。
本发明的另一方面针对一种用于产生目标方向性函数的方法,该方法包括一组空间偏置的HRTF,即选择一组左耳和右耳相关的传递函数(HRTF)。
左耳和右耳头部HRTF乘以相机强调功能(OCE),以产生空间偏向的HRTF。OCE可以设计为修改HRTF的声音轮廓,以在设备录制视频时根据录制设备的方向,在一个或多个所需方向(例如,正好对准摄像头的正前方)上提供强调。
苹果的专利图1描绘了使用期间的未来iPhone(多媒体录制设备);图5示出了未来iPhone的前置摄像头和后置摄像头的方向。
更具体地来说专利图1是一部兼作多媒体记录设备#100的iPhone。 iPhone同时从内置的自由场麦克风阵列#133(由几个单独的麦克风#107组成)以及其两个内置摄像头(第一个摄像头#103或第二个摄像头#106)中的一个进行记录。
麦克风阵列和摄像头已策略性地放置在iPhone的外壳上。此后,当使用多声道音频的空间声音渲染执行录制的音频视频播放时,听众能够大致得出声音的声源位置,从而享受空间感。
图1所示,意味着应在空间上渲染场景中其他人的声音以及捕获的其他环境声音(例如汽车或公共汽车)的声音,但应使听众能够专注于受访者的声音。
苹果的专利图图2是用于输出空间偏置的波束成形系数的音频系统示意图,该系数将应用于未来iPhone的多通道音频拾取;图3示出了用于产生空间偏置的波束成形系数的过程的流程图。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息