文/VR陀螺 冉启行
“一开始我以为做个 AI 眼镜没啥难度,但现在接触下来,真的头皮发麻。如果有全新的初创团队进入,可能连 Ray-Ban Stories 都很难做出来。”从业者瓜籽(化名)对 VR陀螺说道。
AI 眼镜,一个看似简单,却极其复杂的品类。在上一篇文章中《36家厂商,50+产品,AI眼镜「大乱斗」》,我们盘点了目前大概有 36 家厂商布局 AI 眼镜,主要包括三大阵营——互联网大厂、手机巨头以及一众 AR 眼镜公司,如 Meta、百度、华为、小米、星纪魅族、雷鸟创新、Rokid、影目、致敬未知等。
在本轮硬件潮流中,其实很难再看到像 2021-2022 年那样,一波又一波的「新公司」宣布成立,吸引 VC,专做 AI 眼镜品类。即使是像闪极、大朋VR 这样之前并未主攻智能眼镜品类的公司,它们也并非硬件新玩家,亦有自己的核心技术、硬件团队和品牌壁垒。
一方面,受限于大经济环境影响,项目推进已不再如往年那般顺风顺水;另一方面,AI 眼镜其实属于产品、技术、市场门槛相对较高的一款硬件产品,并没有想象中那么简单。
图源:pixabay
从「失败」到「成功」
Meta做对的不仅仅是硬件
时间拨回 2021 年,瓜籽说道:“记得当初 Meta 一代 AI 眼镜产品(Ray-Ban Stories)推出时,有人好奇是否有人对这种产品感兴趣,因为这是 Meta 与 Ray-Ban 的首次合作。”
“在我看来,第一点在于初创公司是否有胆量定义一款全新的产品, AR 公司是否敢去掉显示去做一款眼镜。特别是在第一代产品已经失败后,仍能坚持开发第二代。坦白说,我认为这是很多初创公司都难以企及的一点。”
当然,大公司做 AI 眼镜也不一定会比初创团队更有优势。“对于它们而言,做一款产品能否做到 Top 级别,从某种程度上取决于该项目是否为「CEO工程」。正如小米汽车,如此复杂的工程,在不考虑投入的情况下,从 0-1 只花了三年时间。”
“就目前来看,不是所有大厂都会将 AI 眼镜放到像小米汽车,又或者是 Meta 的 Reality Labs 如此优先级。大厂在立项时,会根据投入资源和优先级进行考虑,团队规模其实并不一定会比初创公司大。”
Ray-Ban Stories
以该维度出发,再回头看,从一款「失败」的产品,到「成功」的产品,Meta 做对了什么?
Ray-Ban Stories 于 2021 年 9 月推出,它被外界称为一款「失败的产品」。Meta 一份内部文件显示,截至 2023 年2 月,该产品共计售出了 30 万台,月活用户约 27000 名,退货率达到 13%。
事实上,30 万台的数量对于初创公司而言并不少,但对于 Meta 而言,可谓九牛一毛,ROI 更是不成正比。
做一个不太恰当的数据计算作参考:售价 299 美元的 Ray-Ban Stories 以 30 万台计算,其销售额仅占 Meta 2021 财年营收的 0.076%(8970万美元/1179.29亿美元)。成本支出方面,包含 AI 眼镜、VR/AR 在内的 Meta Reality Labs 在 2021 年全年整体经营亏损则达到 101.9 亿美元,占到当年营收的 8.64%。
而两年后的今天,二代产品 Ray-Ban Meta 的预估销量已经超过了 300 万台,相比于一代产品近乎翻了 10 倍。Meta 做对的不仅仅是在失败的产品上,吸取经验教训,做用户调研,改善产品本身,还有的是「坚持」做这件事本身。诚然,这与扎克伯格力排众议,特立独行的行事风格也有很大关系。
在不断试错、沉淀眼镜产品经验与技术这一点上,国内星纪魅族、雷鸟创新、Rokid、影目等厂商其实已经做到了这一点。当然,类似于小米等发力较猛的大厂也值得关注。
据 VR陀螺获悉,小米在 AI 眼镜项目上已投入超一年时间,最终可能会发布一款带摄像头的 AI 眼镜,以及一款不带摄像头的纯 AI 音频眼镜,产品将在 2025 年米粉节发布,价格也将极具吸引力。
坊间传言称,正是因为小米在一方品牌 AI 眼镜上的逐步发力,所以导致「原米家AI眼镜」背后公司蜂巢科技另起炉灶,今年开启全新 AI 眼镜品牌——界环,并与宝岛眼镜达成合作,不再依赖于米家生态链。不过,小米仍是蜂巢科技大股东之一,不再合作这一点其实较难评定,只能猜测双方此举可以将利益实现最大化。
做90分以上的AI眼镜很难
「听、说、拍」缺一不可
再来看技术层面,众所周知,消费电子产业有两个形态的产品难做,一个是很大的机器,比如光刻机,另一个就是极小的产品,AI 眼镜则是代表之一。
瓜籽表示:“要打造一款及格的 AI 眼镜,通过各种努力可能实现。但是,要创造出一款 90 分以上,甚至是满分的产品,实际上非常困难。这包括「听、说、拍」三点。”
“比如 Ray-Ban Stories 与 Ray-Ban Meta 两款眼镜,它们的一个区别在于声音的处理。它们是否能够在嘈杂的环境和安静的环境下,都能播放出适中且清晰的声音,这实际上涉及到 AI 音频算法与麦克风、扬声器的结合。例如,在安静的环境中播放过大的声音并不合适,而在喧闹的环境中播放过小的声音则难以听清。”
“对于初创公司而言,这是一道难题,尤其是对于这种软硬件结合的产品。如果 Meta 设计一个眼镜的收音功能,它可以从三麦克风、四麦克风、五麦克风轮流做产品验证。但对于初创公司而言,这样的验证耗时耗力,这可能会耗费半年的时间。因此,初创公司几乎只能 Follow,这是一条 Meta 已经验证过的捷径。”
“成熟的多 Mic 外采方案,目前市面上较为稀缺,科大讯飞、百度、小米小爱,他们几乎都有整个音频算法的团队,也不是一般初创公司可以搞定的。目前靠供应链,可以组装起硬件,但软件层面的优化很难。”
“其次是收音,即说话人所说的内容能够被眼镜准确接收,事实上,当前许多蓝牙耳机都难以实现这一功能;另一个重要功能是摄像头,因为前一代产品配备的摄像头拍摄效果不佳。所以,二代产品 Ray-Ban Meta 也是直接采用了 1200万像素的摄像头,并且搭载了骁龙 AR1 做驱动。”
图源:Youtube@Fresh and Felicia
从上图 Youtube 博主@Fresh and Felicia 拍摄的对比图,我们可以非常清晰地看到 Ray-Ban Stories 和 Ray-Ban Meta 在摄影上的差别,1488×1984 提升的不仅仅是分辨率,更是对于色彩的打磨,远近物体颗粒度的细化,社媒上的直观体验。
“骁龙 AR1 基础性能不错,所以厂商在调教上无需投入过多精力,即可实现良好的效果。而其他芯片,在摄像头上的调教就需要下很大功夫,例如防抖,色彩、光线等,在出片的效果上要花很大的优化功夫。不过,会有一定成本优势。”
然而,据瓜籽介绍,骁龙 AR1 起步门槛也不低,高通的入场券“License” 就需要上百万人民币,再者才能考虑单芯片的价格。如此成本,对于一家初创公司而言,前期投入非常之大。
“此外,在 AI 眼镜的佩戴设计部分也有很多需要优化的层面,这需要大量的人体工学设计。对于初创公司来说,这也是一项艰巨的任务。有经验的主要是传统眼镜公司,但那些眼镜品牌也有自己门槛,对于品牌选择有一定要求,目前来看,基本上是合作一个少一个。”
眼镜是AI最好的载体
但「基础体验」是前提
从公司投入的决心度到 AI 眼镜技术的难点,在 Ray-Ban Meta 上,我们讲述了很多产品设计的环节,但还有一个「很重要」,但也不是那么「重要」的产品点,那就是——多模态 AI 大模型。
瓜籽告诉 VR陀螺,在做 AI 眼镜这件事上,一个往往被忽略的点是 Ray-Ban Meta 的小爆发并未不是因为它集成了特别先进的 AI 大模型,在各种 AI 多模态交互上做得有多好。从某种意义上看,它卖得好的前提是,基础体验做得足够好,正如前面说到的「听、说、拍」。
Meta 更像是给消费者一个允诺,告诉大家这款眼镜后面还会有很多功能,让消费者认为这是值得期待的。在产品的 OTA 迭代过程中,让消费级看到厂商的诚意。
事实上,Ray-Ban Meta 在今年四月才在美国、加拿大部分地区正式上线 AI 多模态能力。而在这之前,它就已经实现了「供不应求」。目前,Ray-Ban Meta 在中国地区并不能调用 AI 能力,不过其在国内销量也不低。淘宝搜索显示,不少店铺的 Ray-Ban Meta 销量都有几百到上千台。
本土用户对于 Ray-Ban Meta 的主要需求集中在「摄影」与「音频」上,AI 调用几乎为 0。这样来看,其实国内 AI 眼镜厂商们还是拥有较大的增长空间,在摄影与音频上,若能与 Ray-Ban Meta 平分秋色,再加之国产 AI 大模型的锦上添花,凭借 960 万平方公里的广阔市场,平替乃至超越其销量也大有可能。
中国 AI 眼镜市场正在加速开发中,更本土化的 AI 多模态与场景融合,更多潮牌与科技公司的结合,2024-2025「百镜大战」总有一款适合你。
对产品需要保持「敬畏之心」
麻雀虽小五脏俱全,AI 眼镜市场虽风风火火,一片热闹景象,但产品远没有那么好做。
一方面,AI 眼镜需要符合人体工学设计,产品不能太大太重,使其佩戴舒适,并且眼镜作为科技属性的潮品,还需要一定的时尚元素,以覆盖更多消费群体;另一方面,在兼顾前者的同时,AI 眼镜需要还需要提供一系列优秀的基础体验,如摄影、音频、交互、连接等,是一个极其复杂的软硬件工程。
在聊天的最后,瓜籽表示:“最关键在于对产品要有敬畏之心,不能想得太简单。我们之前和很多人交流,大家都认为供应链的门槛比较低。我一开始也这样认为,直到躬身入局。”
“比如打电话这个功能,有谁能够让你在不使用耳机或手机的情况下,仅戴着眼镜就能正常通话呢?这看似简单,实则涉及多个方面。首先,你的声音需要清晰,且录音质量不能太差;其次,对方听到你的声音也很重要,同样,对方的声音也需要清晰可听。这些基本要求并非难以实现,但它们直接影响到你是否愿意使用该设备进行通话。”
“产品涉及的细节很多,我不排除哪家创业公司技术能力很强,这些都能搞定。但就怕它漏了一点,可能就是下一代的产品见了。”
正因一款高分的 AI 眼镜产品难做,这也让我们更加期待,中国厂商们交付到消费者最后的产品会有怎样的惊喜。回想中国改革开放数十年,众多产业从落后落伍到走向全球排头兵,是一代人的努力,几代人的坚持。AI 眼镜也同样,路虽远,行则将至。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息