文/VR陀螺
1月13日,VR陀螺 总经理兼主编 案山子 连线博士眼镜 董事总经理 范勤、雷鸟创新 CEO 李宏伟、亿境虚拟 CEO 石庆进行了一场深度连线直播。
直播主题为【传统与科技碰撞,井喷的AI眼镜何去何从】,嘉宾结合今年CES 2025的参展经历,深入探讨了当前AI眼镜市场的潜在机遇、落地难点以及未来的发展趋势。以下是直播文字实录。(为照顾阅读,部分语序略有调整。读者亦可前往VR陀螺视频号观看直播回放)
案山子:我们刚刚结束了CES展会的活动,首先我想听听大家对于CES整体参会感受如何?
范勤:这是我首次参加CES,因此我感到非常兴奋。有一篇报道将CES视为人类洞察科技的未来之窗,我认为这个比喻非常好,因为它体现了科技的巨大进步。在这次体验中,我注意到人工智能的应用场景非常的广泛,除了我们最为熟悉的智能眼镜,我还注意到了人工智能在宠物陪伴、医疗教育等方面的应用,这让我感受到AI已经从理论概念真正走入了我们的日常生活。
许多报道都在探讨AI是否会迅速取代人类生活的许多方面,甚至导致许多人失业。我带着这样一个疑问和想法去观察。确实,AI技术让生活变得更加便利。然而,在我看来,AI全面替代人类在某些领域,比如我们这个行业,可能还需要时间。此外,通过这次活动,我有一个深刻的感受,就是现场来了非常多中国企业,听说累计企业共4000多家,而中国就占了1500多家。海外的中国企业随处可见,这让我感到极为自豪。同时,也为中国企业成功走出国门而骄傲。于此同时,我也深切感受到中国市场的竞争激烈,以及中国企业面临的巨大挑战,转向海外市场确实不易。
展会期间,我最先去到雷鸟的展厅体验了V3这款产品,它刚好在1月7日发布,整体感觉非常轻便,很贴近生活,已经可以成为我们全天候佩戴的眼镜。此外,我在现场也关注了其他一些公司,例如Rokid、XREAL、李未可等几十家AI/AR公司,感觉整个赛道确实非常火热,AI眼镜受到了广泛的关注。我相信随着资本的进入和技术的进步,整个AI眼镜行业将加快发展步伐。
李宏伟:因为我参加CES的次数较多,并且提前与许多合作伙伴都进行了交流,所以我想分享几点我看到的趋势变化。首先,如果大家还记得去年的CES的话,会发现一个显著的变化:在上一次的CES上,有很多令人关注的AI硬件产品,但实际效果并不理想;而今年,AI落地产品变得更加成熟,或者说有一个质变,就是它们确实能被大家接受了。
关于本次展示的AI硬件,包括但不限于AI眼镜、AI宠物、AI机器人等,实际上它们已经获得了大众用户的接纳,日常使用率非常高。其中,许多陪伴型机器人开始实行订阅制模式,这是一个显著的变化。观察技术的演进过程一直让我觉得非常有趣,也让我对AI在未来能够被广泛应用并成为用户持续使用的产品充满信心。
第二,正如之前提到的,我们已经观察到AI在CES领域的渗透率正持续上升。根据今年的情况,虽然可能不是百分之百,但也接近百分之百了,我认为这是一个积极的趋势。CES不仅仅是消费电子展,背后同样有驱动消费电子发展的技术。近年来,AI技术取得了重大进展,我们看到它如何被应用于硬件以及服务于用户,改变生活,这是非常积极的一方面。
第三,我们身处眼镜行业,我确实看到了AI眼镜市场呈现出百花齐放的态势,无论你走到哪里,只要再走50米,就能看到一些或熟悉或不熟悉的做AI眼镜的团队,我觉得这是非常好的现象。我有一个看法,AI眼镜是推动AI及其整个产业未来发展极为关键的环节,其作用甚至可能仅次于AI本身。因为AI背后依赖于收集大量高质量的现实世界数据,而眼镜恰好是收集此类数据的理想产品。
举例来说,当我们使用雷鸟V3时,比如拿起一个水瓶喝水,在这个过程中,AI眼镜不仅收集了桌子和水杯的静态信息,还观察到了我们拿起水杯等具备意图和互动行为的数据,这些数据对AI的发展至关重要,特别是在机器人领域。机器人如果想要理解现实世界,它背后就需要具备类似眼镜的多模态、第一视角的大模型。其次,机器人还需要能够与现实世界互动,具备主动行为的能力。现在很多人在做AI眼镜,我认为从长远来看,这不仅利于AI眼镜产业本身,它对整个AI产业的发展都将带来巨大的推动作用。
雷鸟创新在CES,图源:VR陀螺
石庆:在今年的CES上,我注意到一个显著的趋势,即越来越多的AI产品实现落地,且质量颇佳。以AI玩具为例,不论是触感,还是对话互动,一些产品都做得十分出色,能为用户提供丰富的情感价值。
聚焦到我们所处的行业,AI眼镜作为连接物理世界与AI后端的重要interface,无疑是最佳的硬件载体。与往届CES相比,今年AI眼镜成为了热议焦点,而MR产品的热度则相对有所减弱,且未出现特别突出的亮点。我注意到,尽管头显在教育、游戏和电影展示的机会仍然存在,但行业重点已明显向AR和AI领域倾斜。
回到AI眼镜,亿境目前发布的AI眼镜尚不带显示功能,不过下一步我们也会考虑研发带显示的版本。毕竟AR眼镜的反应速度更快,能够让人更迅速地获取AI反馈。
案山子:目前市场上的眼镜产品主要分为以下几个版本——纯音频眼镜、集成音频和摄像头的拍摄眼镜、带显示的眼镜。在各位看来这三个产品之间的逻辑关系是怎样的?
李宏伟:我认为,从长远来看,这是一个过渡关系。这里面有几个明确的要素,首先是,我们到底需不需要显示,我觉得显示这个事情具备很强的直觉性,这是人机交互的关键,苹果乔布斯在产品设计中有一个核心原则是产品是否符合用户的直觉。以不带显示的AI眼镜为例,在翻译场景中,我们在商场导航看到几家餐厅,如果没有屏幕辅助,就难以分辨出语音指令所输出的是哪一家的信息。因此,显示信息对于用户来说是非常直观且重要的,随着眼镜技术的发展,特别是显示技术的进步和虚拟现实的融合,这将是一个确定性的发展趋势。
第二个问题是关于其替代性和过渡性,其中关键在于AR眼镜是否可以作为一个通用计算平台。以手机为例,尽管市场上有各种拍照和听歌设备,如相机、音乐播放器、手表等,这些市场虽然相对较小,但仍然存在。因此,通用计算平台往往具有较好的兼容性,尤其是对于这些小场景的兼容性。它应用场景更为丰富,所蕴含的势能更强大。基于这两个原因,我认为当前某些不带显示的产品是过渡产品。
第三点,这当然是一个技术问题,或者说TPMF(Technology Product Market Fit )的问题,随着技术的发展,有显示眼镜和没有显示眼镜的成本差距将会缩小,包括佩戴成本和其他相关成本,届时这种效果将会显现。另外,我想谈一下对时间的看法。我对未来持乐观态度,预计到2026年,带显示的AR眼镜将会出现爆发。到2028年,AR会具有比较好的显示以及虚实融合效果。
对于这几种产品的市场规模,我认为带不带显示屏幕的AI眼镜(含AI拍摄眼镜、AI+AR眼镜)在接下来两年都会迎来蓬勃发展。今年我们估计全球可能会有大几百万的出货量,明年预计能够到千万级。因为这类一旦出现了这个压倒性的产品设计之后,它的增长速度会非常快。这其中,带显示AR眼镜可能会稍晚一点,但是我们判断 2026年以后也会迎来快速的爆发,也许2026年的时候这个类型的只是一个百万或几百万的量,但到很快就会出现一个倍数甚至十倍数的增长,并保持翻倍或更高倍速的发展。
石庆:我也认同不带显示功能的AI眼镜将长期存在的观点,因为这类产品轻巧便携,在轻量化与舒适化方面优势明显,一定会持续存在。不过,其何时达到市场平衡点以及具体变化趋势,目前还难以精准预判。另外,带摄像头但不带显示的眼镜会抢占纯蓝牙设备的市场份额。因为声音的input、output以及影像输入功能的转变速度会更快,产品在兼顾轻量化与数字化的过程中,所面临的压力相对较小。
然而在显示领域,我们预计还需等待18至24个月,相关技术才有望逐渐成为主流。一方面,成本与功耗是必须考量的因素;另一方面,应用场景及使用体验也至关重要。毕竟,带显示的眼镜视野中间会有遮挡,用户需要一定时间去适应。当然,随着摄像头和显示器的不断普及,当其达到一定普及程度后,我预测音频眼镜或仅有摄像头的眼镜的市场可能会被逐渐侵蚀。因为对经常佩戴眼镜出门的用户来说,这几类产品的价格差异可能仅在三位数内,而带显示的眼镜功能更丰富且能兼顾佩戴体验,他们大概率不会倾向于选择功能单一的低配眼镜。
亿境虚拟在CES,图源:网络
案山子:由于科技领域与传统领域之间存在一定的隔阂,可能各自的视角会有所差异。各位认为普通用户在选择眼镜时最为看重的几个因素是什么?
范勤:眼镜市场在中国的容量大约接近1000亿,其实在Ray-Ban Meta这款现象级产品出现之前,眼镜行业受到市场的关注度并不算高。这股AI眼镜热潮正在到来,作为一名眼镜从业者,我感到非常兴奋,因为智能眼镜的出现为我们提供了一个新的机会,提高了市场对整个行业的关注度,为眼镜行业带来了新的增量。
就我个人的理解而言,智能眼镜的发展不仅仅是智能硬件的进步,包括模组的不断变小和变轻。同时,随着AI大模型的接入,眼镜的智能化浪潮正在到来。这使得智能眼镜从最初因过重而无法长时间佩戴,到现在可以全天候佩戴,并且款式接近于我们大多数人能够接受的程度。普通眼镜的重量大多在30-40克之间,消费者是可以接受的。而目前智能眼镜的重量大约在50克左右,像雷鸟V3做到了39克,消费者的反馈相当不错。
另外一点在于,不同消费者之间需求都是独特的,部分用户认为眼镜音频和AI交互的结合已经能满足部分需求,也有用户对于拍摄有独特需求。除了刚才提到的音视频功能外,我认为未来AI眼镜可能会出现各种不同的场景。例如,在医疗、教育和运动领域的应用等。当然,如果一个眼镜上需要集成更多的功能,那么对它的要求就会更加高。
案山子:能否聊聊普通眼镜市场的设备更换周期、价格、应用场景、SKU等问题?
范勤:在国内,消费者通常购买眼镜的周期在一年到一年半不等。然而,现在的消费者与以往不同,他们往往拥有多副眼镜,以适应不同的场景,如运动、办公、旅行等。此外,眼镜的类别也有很多,除了镜架的款式非常丰富,满足消费者对于美观、时尚的追求外,镜片的功能也多种多样,如儿童离焦镜、成人的缓解疲劳眼镜,老人的全能花镜,还有近视太阳镜等。每个人实际上不止一副眼镜,如果后面再加上一副智能眼镜,我认为应用场景就更加广泛了。
通常一个店铺的SKU数量在800到1500之间,这取决于店铺的大小,消费者进店的选择性非常高。目前市场上新推出的智能眼镜,由于仍处于起步阶段,款式较少。但各厂家在硬件设计上做了许多改进,例如有的支持更换镜腿等,我看到整个硬件设计也在不断进步与创新。
实际上每个人的需求都不同,每副眼镜都是独一无二的定制产品,从镜架到镜片、屈光度、鼻托的高低、镜腿的长短以及倾斜角等细节问题,这些差异使得眼镜的定制变得复杂。并且,眼镜用户也会考虑到个性化需求,很难像其他标准形态的消费电子产品一样,符合“二八定律”。如果十个人去吃饭,八个人都戴类似的眼镜,他们恐怕是不愿意接受的。
关于价格,博士眼镜划分了几个品牌,总统眼镜价格往往在4000元以上,博士眼镜体系的价格大约在八九百元,而石人工体系的价格则在三四百元左右。我们线上旗舰店也有各种促销活动,价格范围从一百多到三百多不等。这主要取决于用户需求。鉴于中国市场巨大,且近视发病率极高,尤其在一线城市,大学生近视率都已接近90%,这样一个庞大的群体实际上需求非常大。因此,我认为不应过分担心价格问题。这次我们与雷鸟联合推出的1799元的雷鸟V3实际上也已经受到了市场的广泛欢迎。
对于人均配镜数量,大部分视光消费者都拥有两副以上眼镜,尤其是对于那些度数超过300度的消费者来说,眼镜几乎成了他们身体的一部分。他们时刻离不开眼镜,除了睡觉外,几乎全天候佩戴。因此,拥有备用眼镜是非常普遍的现象。
2024年雷鸟创新与博士眼镜成立了新公司,图源:网络
案山子:对于目前屈光近视群体AI眼镜有何解决方案?
李宏伟:由于我们的终端产品直接面向消费者,而且在产品开发的初期我们就考虑了这一因素。例如,不带显示的眼镜只需将镜片放入即可。范总提到,我们与博士眼镜有深入的合作关系。用户可以提供他们的近视度数,我们可能在发货时就将近视镜片嵌入其中;他们也可以选择在博士门店线下验光配镜,这主要取决于用户的选择。
对于带显示的产品,雷鸟在中长期战略上都进行了不同的布局。短期内,我们会偏重ID上的优化,例如将镜片和波导贴合在一起,确保贴合效果足够好,以至于用户无法察觉到这是由两片镜片组成的。从长期来看,我们也在探索一些非常有潜力的新技术,旨在从技术层面上解决所谓的三片合一,即近视镜片和波导镜片的整合问题。另外,我们还在探讨一些颇具前景的波导技术,它们可以实现屈光的即时调节,但目前还处于概念阶段。
案山子:今年AI眼镜业务的增长情况如何?
石庆:这让我想起了2010年平板电脑兴起的时期,市场上的产品众多,应用也十分广泛。实际上,电脑、配件、互联网、AI以及XR等众多厂商都对此表现出了兴趣。可以预见的是,这将是一个百花齐放的阶段。然而,我相信并非每个公司都能成功开发这类产品,因为它涉及到每个人的审美差异,包括安全在内的多方面考量。
AI眼镜在探索过程中,信心、决心和执行力至关重要。以宏伟总为代表的团队,执行力尤为强劲,且处于快速发展的前列,在正确方向上较早出发,使得他们可以快速取得成功。不过由于场景繁多,我认为其他企业在各自具备优势的细分赛道上,同样存在诸多机遇。
范勤:我们从2021年开始关注和研究智能眼镜,从2023年开始销售智能眼镜,已经陆续跟一些知名品牌达成合作,许多消费者通过走入我们的门店,对AI眼镜也慢慢有了更多的了解。一直以来,博士眼镜作为“智能眼镜的最后一公里”,为消费者提供最好的验配、体验场景。他们之前可能在网上听说过,但当他们真正体验到这些智能眼镜时,尤其是具备AI及光波导显示功能的版本,许多消费者仍然感到惊讶。很多人是愿意购买和尝试的。
另外一点,我了解到的是,现在也有人开始将AI眼镜当成礼物。尤其现在临近春节,大家在考虑给亲朋好友送点什么,消费者并不缺乏基本物品,但收到智能眼镜这样的礼物,许多人都会欣然接受,一口气订了几台的也大有人在。我觉得将智能眼镜作为礼品市场也是广阔的,不仅限于个人使用。
雷鸟V3,图源:网络
案山子:对于智能眼镜的多SKU需求您是如何看待的?
李宏伟:不止眼镜,这个时代实际上很多品类都存在多个SKU,衣服产业就是典型,我们见证了时尚、快时尚、超快时尚以及超超快时尚的市场发展过程。然而,电子消费品遵循的是不同的逻辑。我认为将这两者相结合可能会产生有趣的结果。雷鸟也在尝试此类结合,因为新产业或新方向的颠覆性实质上是整个价值网络的颠覆性。从这个角度看,这似乎是一种成本,但从另一个角度来看,它可能是颠覆智能手机产业的一个潜在机会。
在设计SKU时,必须考虑到它作为装饰品的时尚属性,我们在设计眼镜时已经进行了初步的分析。此外,我们考虑了一些基础的方法来降低多SKU所导致的成本,虽然在前面添加摄像头和显示屏会增加复杂性,但仍有技术手段可以实现这一目标。雷鸟在这一过程中其实进行了大量的准备工作,可能后续会陆续向大家展示最终成果或放出相关产品。
另外我想补充一点,处理多个SKU也是一个需要平衡的问题。传统眼镜和电子消费品各有特点,而AI眼镜最终结果很可能是处于两者之间的中间状态,它既不像传统眼镜那样SKU众多,也不像电子产品那样SKU较少。产品公司本身需要具备这样的能力,即判断什么样的设计更可能吸引当前的目标用户。现在AI眼镜的需求还没有那么大,量还没那么多。但从我们用户调研的结果看,用户喜欢什么样的SKU,或者是说喜欢什么样的ID设计,里面还是有迹可循的。
石庆:AI眼镜多SKU需要考虑前期成本问题,以一个做工精良的模具为例,其成本通常在40万-100万之间。这还取决于所需的精细程度。如果品牌定位较高,成本可能还会更高。因此,摊销到每一套产品中,定制费用是必须考虑的。包括电池、喇叭等组件都需要根据产品特色进行定制,这些都会增加成本。
不仅如此,软件方面,包括唤醒词、优化算法、ESI、相机抖动、夜间降噪算法等,均可能影响最终成本。总体而言,如果一年内的销售额不足50K,将会非常令人沮丧。不过之前我们也提到,对于传统眼镜而言,单个款式达到50K已经是一个相当不错的成绩。
案山子:在面对客户时,有没有碰到一些比较特殊的需求,毕竟眼镜属于比较个性化的产品?
石庆:我们致力于寻找最大公约数,关注共性所在。实际上,对于智能眼镜镜头这一块,你会发现其变化并不大。我们主要是在保持其共性的同时进行了一些改进。前框的多种变化和差异可以委托给我们的合作伙伴处理。我们专注于镜头组件的优化,包括电池、喇叭、主板以及高密度排线等部件,通过改进弯折次数多的排线工艺,降低成本和提高良率,以匹配前面变化,从而确保产品上市时间和其他方面的稳定性。这可能是优化生产流程的第一步。
在大家经过12个月或18个月的深入思考和探索之后,我相信人们会更加专注于自己更为擅长的领域。我非常认同范总刚才提到的多元化经营的观点。实际上,我听说传统眼镜行业过去5万台的规模就已经是一个非常大的量级,这即便对于一些大公司来说,也是一个挑战,因为背后涉及到周转、库存、良率等问题。
对于功能, 我觉得AI眼镜其实并不急于实现功能的最大化。首先应该设计出美观、时尚、轻便和舒适的眼镜。这是至关重要的第一步。随后,我们可以逐步增加更多功能,让大家在逐渐熟悉并接受这一品类的过程中,而不是一次性提供过多的信息。我们曾涉足MR市场,发现一个重大问题:普通消费者接受新事物的速度远低于我们的预期,过于复杂的产品是不被他们所接纳的。
我认为,在推广过程中,大家应尽可能地在产品定义等方面逐步增加复杂性,给客户一个适应的过程。不能因为客户想要所有功能而不得不去创造需求。大家有时过于追求自身领域的独特优势,但也要避免创造不必要的需求。
另外,我也想要补充一下,最近亿境联合博士眼镜成立了一个AI眼镜联盟。我们的初衷是,这个联盟里的各个会员单位能够像以前深圳模式那样,形成一个供应链集群。如果这个行业足够成熟,大家都能很好地组织自己所擅长的业务的话,我坚信这将能够为全球提供高效、快速且成本低廉的各种解决方案,最终是有可能打造对标Meta等大企业的好产品的,也希望能有更多的实力型会员单位加入进来。
亿境虚拟CES展台的AI眼镜,图源:网络
案山子:AI眼镜是一个系统性的工程,涉及相机调优、定向传音、芯片算法等,您觉得当前产品还有哪些值得提升的地方,背后如何实现?
李宏伟:我想从两个层面进行讨论。首先,尽管市场上已有很多产品,但许多产品的潜力尚未充分挖掘,无论是您提到的音频、拍摄,或者是其他方面,都还有进一步改进的空间。因此,建议大家在这些方面投入更多精力。
比如石总刚才提的,如何在暗光环境下增强图像,以及降噪技术如何实施,特别是在暗光条件下的降噪处理,仍然是一个挑战。目前,由于眼镜上的摄像头硬件限制,其感光元件的尺寸不可能特别大。因此,对于不同公司而言,挖掘的潜力可能有所不同。哪怕Meta的摄像头表现优秀,也仍有进一步提升的空间。
类似的,还有Speaker(扬声器),尽管现有的 Speaker 效果尚可,但其声腔结构相对较小,这会影响在更大环境中的听觉效果。对于那些做得比较头部的企业以及表现比较好的公司来说,它们也在专注于定制化的工作。如果问我这些包含定制化组件的产品什么时候能出,我觉得今年底明年初应该会有比较ready的产品出来。
案山子:您如何看待大家趋近于Ray-Ban Meta的设计——AR1芯片+1200万像素+4阵列麦克风?
李宏伟:根据目前市场上可选择的方向,我们认为这是一个较好的搭配。判断方法也相对直接和粗暴。Meta已经开发了两代产品,我们可以粗暴地认为Meta已经尽可能选择市场上最合适产品和组件,现在的产品是他们经过各种权衡之后的设计选择。因此,从结果上来看,这也是一个较好的选择,当然这也包括了AI的长期发展,因为使用某些芯片可能无法运行本地的优秀AI功能。
案山子:您觉得在开发雷鸟V3的过程中主要难点都有哪些?
李宏伟:我认为,如果要让AI在眼镜上表现得出色,关键在于对大模型的接入和调用。简而言之,直接将基础大模型套到眼镜上是不行的。为此我们与阿里合作进行了多项优化。然而,工作远未完成,包括增量训练,我们需要对大模型本身进行修改,这是一个关键任务。在此过程中,我们发现还有许多提升空间。
除AI大模型外,在当前环境下,要调优摄像头并使其拍摄质量达到极致,仍是一项具有挑战性的任务。如果与Pocket 3这种手持相机相比,AI眼镜没有云台,防抖功能需要做得好难度会更高。另外,眼镜硬件空间小,传感器也会相对较小,而Pocket 3底部为一英寸的传感器,难度要低得多。因此,优化拍摄效果是一项持续的工作。
另外,拍照还有一些比较细化的东西,比如弱光、暗光、逆光、曝光倾向等,这实际上涉及多个维度的调整,包括硬件层面,如芯片ISP的性能是否足够强大?摄像头拍摄后预处理的程度如何?处理完之后,图像视频的优化算法是否足够先进?是否需要使用HDR技术,或者拍摄多张照片进行融合,以改善暗光环境下的图像处理。这一系列问题本质上都涉及到投入的问题,即你是否认真对待和投入资源。
在这方面,我认为雷鸟确实有值得夸耀的地方,我们仍在持续优化多个方面,同时也确实进行了较大的投入。举个例子,眼镜戴不正导致拍出来照片歪的问题,它几乎必然会发生,因为没有人的头能够保证是完全水平的。因此,我们开发了地平线矫正功能,将其融入算法中,这样几乎每次都会用到,它能自动调整照片并将其矫正至较为水平的状态。
TCL本就拥有专门的Camera Lab,并投入了巨额资金,上亿资金,用于整个系统的优化。我们与顶级算法公司虹软合作,一起给V3的影像系统做调优。我们在此领域投入了巨大的努力,并持续进行改进。我们会定期对拍摄效果进行提升,加入艺术处理元素,并进行升级,以提供给用户更好的体验。
案山子:您对于AI眼镜开发有何经验看法?
石庆:AR1芯片的功耗并不会特别高,实际上它采用了4纳米工艺,并且它是专为智能眼镜设计的,集成了ISP等,目前市场上尚未见到其他专门为智能眼镜设计的芯片,整体表现还是相当不错的。正如刚才提到的,Ray-Ban Meta是一款在市场上已经经过验证的产品。
虽然这款产品已经做得很优秀,但我们仍能够挖掘出不少的应用场景。举例而言,为什么很多人都会倾向于选择681摄像头模组,原因在于它能够支持一些端侧DNN模型的拍照体验。我们在展台上首次展出一款设备,只要用户比出“耶”的手势或扫描二维码,它就能执行相应的动作。我认为这种交互方式比传统的触摸更加直观和有趣。但这些设备需要能够快速地做出反应,而不是将信息上传到云端。正如我一直提到的Always On概念,这些还是要满足的。
现在选择索尼CMOS的比较多,原因有两个:一是其经过验证的可靠性,二是它支持端侧DNN算法。尽管我们也有看到其他选择,但这些选择都包含一些未知因素,我们也和索尼方面进行了交流。我们首推681,因为它们将集中精力解决DNN端侧的问题。目前,连Meta在这一块都没有完全调好,我认为这个眼镜还有很大的改善空间。我们也将看到后面还有许多有趣的事情,就是主控芯片和端侧sensor的打通配合。
此外,数据存储和安全问题也非常重要。因为以前我们一直做MR,实质上一直是缺乏数据和内容的。但到了AI眼镜,数据导出到手机可能会很快存满,这就涉及到了存储和安全问题。
无论是数据存储本地还是上传到云端,其中都蕴含着商机。我们为此开发了NAS,用家庭计算中心以配合这一过程。眼镜拍完后,照片可以立即上传至NAS,并且很快就能在您家的智能相框上展示出来,比如你在美国拍的照片,你的家人或爱人立刻就能在中国的家中看到,这种体验是非常强烈的。我认为,整个生态链的打通,或者说能够有更好的APP的衔接,这些都是这个产品需要做的。
我认为,如果能够理解市场需求,产品将得到市场的积极反响。其次,从设计和制造的角度来看,这确实需要坚定的投入,我认为不是随便参与就能做好的。
就如同当初平板电脑市场的情况,看似机会众多。当时有传言说深圳有上千家企业都声称自己在生产平板电脑。但实际上,这些企业并非都生产整机产品,有的负责外壳材料的供应,有的专门制作喇叭,有的则专注于天线或排线的生产。如果各个领域有两三家或三四家能够崭露头角的企业,那么在整合方面,就能挑选到一些性价比高且专注眼镜行业的企业,为行业提供服务,这也是我们非常期待的。
AI眼镜爆款Ray-Ban Meta,图源:网络
案山子:在AI眼镜的摄像头调优等方面,手机厂商是否具有先发优势?
石庆:手机厂商肯定有自己的优势。我们了解到一些手机厂商已经开始重视并投入资源开发这方面的技术。除了拥有深厚的供应链优势之外,他们甚至有些还有门店。此外,眼镜短时间内还是离不开手机的,里面有一个衔接过程,他们在这个领域其实有着一定的天时地利。不过这是否就意味着他们能够取得绝对优势呢?那也不一定。
实际上,新的领域总是孕育着新的机遇,否则这个世界格局将永远不会改变,总是强者越强。我认为,这与他们的投入、人才的选取,以及投入的时机都有关系。也许他们晚了一步,或者错过了某个关键时机。很多人都说,AI眼镜未来会成为下一个计算平台,那么手机厂商在这条赛道上也是在革自己的命。是否愿意自我革新也是颇具挑战的问题。
李宏伟:手机厂商在拍照方面积累了很多技术,但是它并不能完全适用于AI眼镜。手机拍摄组件的空间要求并不算苛刻,它能涉及多个摄像头、光学变焦以及闪光灯,同时芯片能力也十分强大,我不清楚大家是否了解,手机上采用了各种激进的优化方法,使用了强大的算力和拍照技术。
例如,通过拍摄多帧照片进行降噪处理,可以有效降低噪声水平。因为多帧图片中噪声的出现情况各不相同,某些元素在图片中方向略有差异。因此,在优化算法时,针对眼镜和手机的拍摄优化方向有所不同。虽然过去的经验有一定帮助,但也不能完全照搬。
案山子:如何看待Always On导致的隐私与功耗问题?
李宏伟:实际上,数据收集的链路本身是可行的,只要你想收集数据,就可以进行收集。这里暂时不考虑隐私问题,它的链路本身是通畅的。至于设备本身的限制,例如Always On对功耗的限制,这些问题也有技术方法可以解决。我们很多技术研究,需要确定哪些场景确实需要持续收集数据,这不仅对技术有要求,也对用户和场景的洞察至关重要。这是首要问题。
隐私问题在某种程度上是一个底线问题。我们有一个底线要求,产品至少要符合这个要求。随着时代的发展,底线要求可能会发生变化。以手机相机为例,过去很多国家要求手机拍照都需要发出声音,而现在只有日韩还有这样的法定要求,这是社会习惯和接受度提高的结果。我相信,未来在AI眼镜方面也会出现类似情况,符合当下的要求就行。目前雷鸟的做法是产品配备一个闪光指示灯,在拍摄时会提醒用户,类似于过去手机在拍照要求严格时的做法。
当然,对于隐私问题,我们也在进行一些设计探索,使得它在这方面能更优雅一点。比如说可以在摄像头前面加一些遮挡,从而减轻人们在某些场合的社交焦虑,我们正在研究这些设计,后面不排除会推出类似的配件。
石庆:隐私问题实际上可以分为两部分:个人隐私和他人隐私。其中他人隐私比较显性,西方很多国家对这一问题在持续关注。我认为确实需要一个指导部门,未来有行业协会介入,在隐私保护方面制定一些行业规则,如拍照闪烁等,实际上这也是我们成立AI眼镜联盟的初衷之一。不过目前AI眼镜所涉及的量还不算太大,我觉得我们目前应该先继续前行,不必过于纠结。
关于个人隐私问题,我们经常讨论和分析,大家的数据可能不适合上传至云端,而更适于存储在个人手机、电脑或家庭服务器上。总之,能够在边缘侧进行存储。而且,随着未来AI眼镜使用频率的增加,数据量也将显著增大。因为后面涉及到AI对你的理解问题,它需要长期大量保存数据。AI收集数据,其实也是一个自己认知的积累过程,甚至在年老时,人们反过来需要依赖年轻时的数据来支持决策,这是一件颇具意义的事。因此,我认为一个较好的解决方案是找到方法将你和家庭的数据都存储在本地。这可能需要准备几十个T的存储空间来容纳我们多年积累的数据。
雷鸟V3展示的AI玩法,图源:网络
案山子:关于AI眼镜的云端模型与端侧模型的探讨?
李宏伟:当前眼镜的AI应用场景主要体现在两个方面:一是对话与问答,如语音搜索,这是使用频率较高的。二是视觉识别,这主要包括两个任务,其一是翻译,例如识别图片中的文字;其二是学习,比如识别公园树上的黄色花朵和叶子,还有其他未知的事物。如果再接下来,可能它将会成为一个智能的个人助理,这个智能助理拥有第一视角能力,未来能够执行诸多任务,如日程安排,像一个助理一样通过对话帮你规划一系列行程的解决方案。这是在工具层面的应用。此外,在情感陪伴方面,AI也能提供支持。
关于端侧和云侧的问题,端侧模型当然在快速发展,但短期内,前面提到的眼镜场景还是以云端AI为主。事实上,目前即便是在手机和PC上面,端侧模型的表现也并不足够理想。现阶段,眼镜上的端侧模型主要是一些服务基础功能的小模型,比如特定语音指令模型、翻译模型等,这背后的选择取舍关键在于产品体验和用户需求。
另外,也有人认为AI眼镜可以调用手机算力以减少对云端的需求,但我认为手机和PC端侧的能力尚未充分发展,至少目前还不是很成熟。其次,如果要连接手机获取手机端的能力,就需要明确哪些场景比云端效果更好、速度更快,目前我看到的用例并不多,如果云端有一个优秀的模型,为什么还需要在端侧进行呢?当然了,这仍是一个值得探索的方向,雷鸟也在与高通合作研究这一方向,并在高通峰会上展示过相关成果。
石庆:目前的情况是,由于多种原因,端侧的效果还不是特别好。可能有一个过程,但是它已经可以跑一些小模型,比如在Sensor上的DNN,其实它反应是最快的,但目前存在一些功耗等方面原因。AI眼镜与手机配合也是一个值得探索的方向,如今的智能手机大多具备AI功能,其算力往往超过15T,能够执行一些基本任务。但总体而言,目前看来,云端处理仍然是主流,而且云端服务的效果也相当不错。端侧目前的迫切性不是很高。
我再补充一点,我们经常会谈到云边端,未来端侧算法可能会应用于手机、平板等设备,而边侧我们预计,它可能会被部署在中小企业或家庭环境中,供多人共享其计算能力。无论是以家庭还是小企业为单位,让其同时承担存储和计算任务,实际上可以完成许多工作,由于这类设备通常会长时间通电,因此其计算能力和稳定性是有保障的。
案山子:关于AI眼镜操作系统的问题?
石庆:因为我们做过VR和MR项目,之前一直没有一个统一的操作系统,也缺乏背后的内容生态,我们也是走了很长一段时间很艰难的路。产品要么成为游戏机,要么就成为视频播放器,这个局面确实比较尴尬。
因此,我们一直密切关注生态系统这一块的发展,如果谷歌在2024年12月中旬发布的Android XR能够解决这些问题,那将是一个非常积极的信号。这将使得硬件或品牌企业不仅在国内,也将有机会接触海外项目。特别到了后期,眼镜接入显示,背后更依赖于这么一个生态系统,我们对这一领域未来充满信心。
李宏伟:首先,从长远来看,我们肯定会与操作系统(OS)合作。操作系统不仅涉及技术问题,更关乎生态,这包括开发者的兼容性以及硬件芯片的兼容性。因此,操作系统通常需要保持一定的统一性。基于此,我们倾向于与行业领先的OS公司建立合作关系。
其次,在操作系统准备好之前,我们确实需要发布产品,我们不会在操作系统本身中投入过多的资源,但会专注于为用户提供优质的第一方应用,比如翻译、拍摄、音乐等,目前这些应用都是雷鸟自己做的,我们在这些应用上面花了很多的力气。
第三,对于开发者平台而言,时间也是一个关键因素。如果在后期有一个比较通用的OS,那么这个OS自然会在开发者平台上推出。但在那之前,我们仍需完成一些重要的工作,所以雷鸟也有自己的开发者平台,目前全球已有上千名开发者在为我们开发应用。即便未来市场出现了通用型的OS,但我们也会推出一些个性化的SDK,因为我们还有比较领先的硬件和底层软件的功能。
案山子:今天的分享就到这里,感谢大家的参与,再见。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息