文/VR陀螺 万里
去年年底,谷歌发布了其XR操作系统Android XR,该系统的最大亮点在于高度集成Gemini,可以实现画圈搜索、全局AI助手等能力。
对于Vision Pro而言,它也没有忽视AI的重要性,其在最新系统版本visionOS 2.4中引入了对Apple Intelligence的支持。
在AI的加持之下,Vision Pro能否改头换面?
图源:网络
设置加入“Apple Intelligence”选项,重点在于写作、画图两大板块
目前想要体验Vision Pro的Apple Intelligence,用户需要先将系统升级为vision2.4最新版本,此外,还需要将设备语言以及Siri语言均设置为美式英语。
当进入新系统,可以发现它的主页UI并没有太多变动,但是有些地方可以让人隐约察觉出它暗含的AI能力,比如设置选项中多出了一个Apple Intelligence开关选项,搜索栏点击后会出现一个苹果经典的环形彩虹圈动效、控制中心新增了一个新款Siri图标等。
注:对于国内用户而言,Vision Pro的很多AI能力仍未对外开放,部分功能体验会结合官网资料进行讲解。
图源:VR陀螺
更智能的Siri是笔者最期待的功能,可惜在这一方面Vision Pro的改进并不算多。
在手机端,Siri可以处理一些简单的操作,如定闹钟、创建备忘录、打开关闭APP等,这些在头显端同样可以实现。
除了以上常规功能,Siri似乎专门针对Vision Pro进行了一些特定优化:
1、融合了眼动追踪,Siri可以获悉用户视线聚焦的方向,基于此,用户可以看着某个联系人图标并让Siri给该用户发送信息;
2、地图应用有所改进,如当你说“show me some coffee shop”,Siri会自动弹出潜在门店,用户可以进一步跳转地图APP以查看门店评分等信息。
图源:VR陀螺
3、呼出Siri的方式更加多样化,除了语音唤醒,用户还可以通过控制中心以及妙控键盘(Fn+S)打开。
Siri的手势入口,图源:VR陀螺
除了以上小幅度改进外,Siri能力并没有本质提升,它并没有变得更加聪明,你无法跟它长时间聊天,很多时候询问它一些问题也只会简单粗暴弹出搜索链接。
其次,它不支持类似Android XR的多模态能力,后者不仅可以识别屏幕窗口内容还可以查看透视相机所看到的真实世界画面。因而Siri整体看起来仍非常呆板。
根据苹果宣传信息,visionOS 2.4在AI写作能力方面具有较大提升,这对于头显办公用户而言是一大福音。(该功能未能顺利体验,部分资料来源于苹果官网)
在邮件等写作环境下,当用户选择一个文本段落,系统会自动弹出一个“Writing Tools”选项,而后用户可以基于AI工具进行校对、重写、总结等操作。
其中校对功能可以协助检查文本中的语法以及拼写错误;重写功能可以帮助调整文本的写作风格,如让行文看起来变得更加友好、更专业或者更加言简意赅等;总结功能则可以快速整理出文章的核心内容,并支持文本导出。
值得一提的是,visionOS 2.4还引入了ChatGPT,(需要在设置入口单独打开),在ChatGPT的加持之下,用户可以进一步体验长文本生成等功能。
其他方面,信息和邮件应用中新增了智能回复功能,AI可以基于此前收到的信息给用户提供相应的回复建议。在通知栏,系统会自动对信息进行整理,并生成通知摘要等。
图源:Apple
Genmoji是新系统的另一个重要的AI能力,简而言之,用户通过键盘输入表情符号时,会发现键盘中多了一个文生AI表情包功能,生成后的表情包可以通过Messages应用发送给好友。
基于苹果演示视频来看,AI表情包生成速度较快,并且十分可用,但就个人而言,我并不喜欢AI生成的呆板表情包。
图源:苹果
在相册端,Vision Pro同样进行了较大的改革。目前笔者能够体验的功能之一是相册2D转3D,如下图所示,打开相册后,部分相片左上角会多出一个“Spatial”按钮,点击后系统会进一步处理照片并生成一张具有空间景深感的照片。
Vision Pro的2D转3D过程,图源:VR陀螺
虽然从上图无法直观感受到3D图片的生成质量,但根据笔者主观体验,它的效果会优于市面上大部分VR/AR厂商的同类型解决方案。此外,2D转3D,有些时候会提供一些独特的体验,比如有时候你看一张2D图片时会忽视里面的人物、物体的前后站位等信息,但是启用3D后系统会将这些深度信息重现在你眼前。
当然,2D转3D并非所有图片都适用,一些人物过多的聚会场景以及部分动物、风景类照片不受支持。
除此之外,相册还新增了自然语言搜索以及创建记忆影片功能(这两项功能未能顺利体验),其中自然语言搜索可以通过文本/语音描述的方式快速找到某张照片以及视频。而创建记忆影片功能可以基于图片库已有的照片视频资料生成带有故事情节以及专属配乐的影片。
Vision Pro相册的电影生成功能,图源:苹果
visionOS2.4 特色APP体验:优雅但单薄
伴随着visionOS 2.4推出,苹果还为Vision Pro准备了几款第一方APP,其中一些APP旨在用于扩展头显端的AI体验,如《Image Playground》;一些APP旨在用于补充头显的内容生态,比如《Spatial Gallery》;另外还有一些APP旨在加强不同设备之间的连接管理能力,比如iOS端的《Apple Vision Pro》APP。
这是一款图像生成APP,底层由Apple Intelligence驱动,目前已经在iPhone、iPad以及Vision Pro上线。(该应用需要在设置栏中启用,国内同样不可用)
根据描述,Image Playground可以将相册的照片进一步加工,如增加人物、改变风格背景等。此外,它还能将不同照片元素“缝合”在一起。
不过,该应用在iOS平台评分不佳,只有2.5分(5分制),这是一个颇为糟糕的成绩,很多负面批评集中在AI听不懂具体指令、生成画面质量一般、使用场景有限等。
《Image Playground》iOS版,图源:网络
在Vision Pro端,该应用评分数只有3个,暂时没有相应的评论信息,这侧面反映了头显用户对于该应用的使用意愿确实不高。
有海外用户指出,《Image Playground》可以生成2D图片,然后再通过相册的spatial功能实现3D化。随着后续Apple Intelligence以及Siri能力的提升,用户或许能够直接通过语音指令生成相应的2D图片甚至3D模型,这是一个值得期待的发展方向。
《Image Playground》Vision Pro版,图源:网络
我们可以发现,对于AI文生图功能,苹果显得非常谨慎,对于不容易出错的小表情包生成功能Genmoji,它选择直接集成在系统端。而对于玩法更加多样化,但是更容易“翻车”的大图片生成,苹果选择以APP的形式发布,并且将它的功能限制在了图片再加工层面,这可能有利于规避部分负面的结果。
这是一个空间视频/照片精选应用,里面收集了部分由艺术家、电影制作人和摄影师创作的空间照片、空间视频和全景图作品,主题涵盖影视创作、艺术、文化、旅行等。
此前Vision Pro已经不乏一些空间照片/视频APP(如kandao XR),苹果推出《Spatial Gallery》后可以进一步补充头显的内容生态。只不过从目前来看,《Spatial Gallery》的内容库仍十分单薄,平常内容更新频率也很低。
其他方面,该应用的评分数只有40,成绩同样颇为惨淡。
图源:VR陀螺
写在最后
Vision Pro visionOS 2.4版本更新后引入Apple Intelligence,这对于MR办公用户而言可能十分受用,但对于普通玩家而言,这些单薄的AI能力所带来的吸引力仍十分有限。
由于苹果对于AI功能的克制,并且追求功能的完成度,使得它在功能丰富性方面慢了半拍。当然,也有人认为苹果对于隐私问题的过分执着使得其在AI功能开发上显得畏首畏尾。
不过,无可否认的是,从长远来看,VR/MR深度集成AI会是一个重要趋势,苹果还在不断迭代优化当中。
近期苹果在AI方面动作频出,比如前Vision Pro负责人Mike Rockwell已于近期接管了苹果的Siri团队,此举旨在加速开发更加个性化的Siri,乐观预计Vision Pro的Siri将会在明年得到“改头换面”。
此外,苹果预计会在今年6月发布visionOS 3,有消息指出,“这是一个功能丰富的版本”。届时不排除设备将会加入更多AI能力。
visionOS无疑是一个优雅并且完成度较高的系统,但是从目前来看,它在AI方面的动作缓慢,随着后续搭载Android XR的头显设备推出,它在AI功能体验方面将不会有任何优势。对此,苹果还需要加把劲。