AR 和 AI,将迎来一个互相成就的机会。
今年的 CES,注定离不开两个关键词,XR 和 AI。
就在开幕前两天,1 月 8 日,苹果宣布将于 2 月正式发售去年推出的混合现实头显产品,Apple Vision Pro。
这让 XR 产品再次成为了今年 CES 的焦点,过去数年,所有人都在等待 XR 的「iPhone 时刻」。随着苹果正式入局,期待被带向一个至高点。
目前 XR 市场的热度很高,资金和关注度的热潮高涨,但依然鲜有一款产品能做到「一锤定音」。从几百元的音频眼镜,到数万元的 Apple Vision Pro,厂商都还处于探索的阶段。并没有出现一款产品,像 iPhone 之于智能手机一样,定义一个明确的未来形态。
市场等待的,与其说是某一个品牌的某一款产品,不如说是一个真正可用、有用、好用的产品范式。
过去十年,XR 领域的焦点一直集中在 VR 头显上,AR 眼镜的技术路线,在几家大厂尝试并失败之后,一直处于被忽视的行业「背阴面」。
但随着技术和市场的发展,AR 产品范式的轮廓正逐渐浮出水面,变得愈发清晰。就在今年的 CES 上,雷鸟创新展示了旗下最新一代的 AR 眼镜产品雷鸟 X2 Lite,不仅实现了双目全彩显示,还将整机重量降到了 60g 左右,几乎达到了普通墨镜的水平。
雷鸟 X2 Lite | 来源:雷鸟创新
与此同时,AI 大模型技术的涌现,也为 AR 眼镜的未来,提供了一些全新的应用思路。
重回正轨的 AR 眼镜
自 2015 年,上一波 XR 热潮开始,头显设备的主旋律就一直是 VR。
无论是早期的 Steam VR、PS VR,还是后来被 Meta 收购的 Oculus,他们产品的核心应用都是游戏,要把用户置于一个虚拟世界。
2020 年,随着居家办公、娱乐成为一大趋势,「元宇宙」概念开始流行,并最终导致 Meta 决定 all-in 元宇宙,掀起了第二波 XR 热潮,影响了一整代 XR 产品的设计思路。
到今天,大部分具备 AR 能力的头显,包括 Oculus、Pico 的产品,以及 Apple Vision Pro,采用的都是「摄像头拍摄,头显内屏幕显示画面」的 VST(video see-through)方案。
这类 MR 产品尽管具备一定的 AR 能力,但从设计上,它们全都以「头显」的形态呈现,依然是「仅限于在室内使用」的设备。
与此同时,也有不少厂商在探索 AR 的另一条路——OST(optical see-through)方案,尝试打造一款真正的「全天候 AR 眼镜」。
与 VST 是将外面的物理世界以视频化的方式投入人眼不同,OST 是让物理世界以光学透视的方式进入人眼,并通过设备上的光机叠加数字信息,从而实现增强现实的效果。显然,从硬件的终极形态上看,OST 才是 AR 的最优解决方案。
AR 的本质是虚实融合,OST 以高透过率的光学方案,让虚拟画面直接投映在现实世界中,可以大大减少了对设备的延迟、坐标定位、传感器、算力、功耗等方面要求。
十几年前,最早将 AR 概念带入大众视野的谷歌眼镜采用的便是 OST 方案,此后包括微软的 HoloLens,以及明星创业项目 Magic Leap,也沿用了这一方案。
但这些曾被寄予厚望的 AR 项目都在消费市场遭遇了困难,最终转战 B 端。其原因,不仅是成本过高、售价动辄数千美元,且显示、佩戴等体验差强人意,应用场景也非常有限。
OST 方案最大的难题在于光学显示。
早期谷歌眼镜采用的棱镜方案,投射出来的图像尺寸小、亮度低、存在较大畸变,棱镜镜片的厚度、重量也很大。之后也出现过 Birdbath、自由曲面、全息透视等光学方案,各自都有优点,但也都各自存在视场角、亮度、清晰度、重量等方面的短板,无法支撑一款真正能够达到「通用级」的设备。
在各种光学方案中,天花板最高的还是光波导方案。简单来讲,其原理是通过在透明的镜片内部构建可供光线传播的通路,将微型显示模块发出的光,引导至镜片的显示区域,叠加在用户的视野上。
除了光学系统,显示更是一大技术难题。它必须足够小、功耗足够低,但同时又必须提供超高的亮度,才能保证在户外超强的背景光下,用户也能看清眼镜上显示的内容。普通的 LED 显示技术难以微型化,硅基 OLED 则达不到足够的亮度。能达到 AR 眼镜要求的光机,MicroLED 是最优解。但 MicroLED 全彩化方案方面整体技术难度较高、且量产良率低,目前市面上的产品基本只能做到单色。
雷鸟是最早开始尝试将全彩 MicroLED 技术应用到消费级 AR 眼镜上的公司之一。通过将红、绿、蓝 3 个单色 MicroLED 屏幕合成彩色显示方案,雷鸟打造了出了第一代超小型全彩 MicroLED 光引擎,并实现了全画幅像素微米级的高精度对齐。2021 年 10 月,雷鸟发布了第一代双目全彩 MicroLED AR 眼镜——雷鸟智能眼镜先锋版。
此后,雷鸟又自研了全彩 MicroLED 量产解决方案,并陆续在全彩显示、光波导亮度、全自研光引擎精密及小型化等关键技术上进行攻坚,将 OST 显示技术从实验室推向市场。
消费级 AR 眼镜的产品新范式
这一系列 OST 显示技术的创新,集中体现雷鸟旗下的两款真 AR 眼镜上——雷鸟 X2 和雷鸟 X2 Lite。
雷鸟 X2 是雷鸟创新去年发布的产品,也是全球首款量产和发售的双目全彩 MicroLED 光波导 AR 眼镜,它能实现>85% 的镜片透光率、1500 nits 的峰值入眼亮度,和 3D 全彩显示,即便在晴朗的室外,也能清晰显示内容。
而雷鸟 X2 Lite,是 X2 的迭代版,整机轻量化有了全面提升。全彩光引擎经过新一轮极限缩小,重量降低了 30-40%,结合波导设计、材料创新上的突破,以及全新的工业设计,雷鸟 X2 Lite 的整机重量从前代的 119g,降低到了 60g 左右。这个重量已经低于很多时尚板材眼镜,对用户来说,则意味着它可以实现全天候的无负担配戴。
光学显示系统的改进,为 AR 眼镜提供了一次「重回正轨」的机会。今天的 AR 眼镜不再笨重,显示效果也有了充分保障。
而在应用层面,伴随着硬件形态的确定和芯片算力的提升,AR 眼镜应用场景的定义也在变得越来越清晰。从面对面翻译、AR 导航,到 Widgets 小组件和抬头显示……AR 眼镜的使用场景并不像 MR 头显一样,与手机、电脑互相排斥,而是可以全天候佩戴,融入用户当下的数字生活,与手机电脑协同工作,互为补充。
如果与此前的个人计算设备相比,MR 头显更像是「台式机」,AR 眼镜则像一款移动设备。在经历了十几年的沉寂,长期被忽略之后,AR 眼镜终于回到了发展的正轨上。
除了大幅改进光学方案,雷鸟 X2 Lite 还有另一项关键的技术,是其搭载的与高通合作的新一代 AR 芯片——骁龙 AR1。
AR1 是高通专门为 AR 眼镜打造的芯片平台。考虑到 AR 眼镜产品极致的轻量化需求,AR1 把能效控制作为一个关键的指标进行了优化,芯片本身的体积也大幅缩小,这也是 X2 Lite 能相比前代产品减重一半,并依然能保持良好散热的原因之一。
此外,AR1 搭载了高通的第三代 NPU Hexagon,大大提升了神经网络的计算能力,这帮助 X2 Lite 更好地优化图像和光学的算法,从而降低延迟并提升了最终的佩戴体验。
大模型为 AR 带来新的可能性
除了硬件本身,雷鸟 X2 Lite 的另一个重大的更新是 AI 能力的加持——雷鸟 X2 Lite 加入了 AR 眼镜的大模型语音助手 RayNeo AI。
Reyneo AI 将传统的系统语音助手与 AI 大模型打通,加入了多轮自然语言对话、上下文理解、行程规划、百科回答等能力,极大扩增了 AR 眼镜的应用场景,让用户能够以一种更加自然的方式,与现实世界进行信息层面的交互。
举例而言,以往规划旅游行程时,用户需要通过多个软件,查询天气、交通等信息,而有了 RayNeo AI 的加持,只需要戴上眼镜,即可一次性完成天气、出行交通、景区景点等信息查询,快速规划个人行程。据雷鸟介绍,未来,RayNeo AI 还将加入视觉理解能力,进一步探索多模态信息交互能力和场景,帮助用户实现「所见即所知」。
大模型拥有的,是革命性的「处理信息」的能力,而 AR 眼镜能颠覆的,则是「输入输出」的效率。AR + AI 的化学反应,还存在更多可能性。
作为一个全天候佩戴的产品,AR 眼镜可以将大模型能力带入真正的高频场景。不只是语音助手会变得更好用,翻译、识图识物、导航等等应用,都可能通过与大模型能力结合,得到体验的跃升。
AR 眼镜作为一个架在用户眼前耳边的设备,它距离用户所感知的信息,天然是最近的,也更便于大模型发挥它的多模态处理能力,让大模型成为用户的「信息处理前端机」,实现很多无感的交互设计。
打个简单的比方,现在用户拿到一份纸质材料,或许要用手机拍照,图片转文字,再输入到 GPT App 里,让 AI 进行翻译,生成摘要。而如果通过一款具备大模型能力的 AR 眼镜,可能当用户看向这份材料的时候,大模型就已经完成了信息的提取、处理,把结果显示在 AR 眼镜上了。
对于 AR + AI 的化学反应,雷鸟创新 CEO 李宏伟也表示,关键在于处理和交互的效率提升:「AR 眼镜实现了跟感官系统的高度一致性,可以做到看你所看,听你所听,在你眼前,在你耳边,你不需拿起手机就可以实现所有的信息交互。」
雷鸟创新 CEO 李宏伟在极客公园创新大会舞台上演讲 | 来源:极客公园
从这个角度来说,AR 和 AI,正迎来一个互相成就的机会,有机会定义一种全新的,未来的信息终端。它可能会成为用户一种新的「外脑」,与用户眼睛、耳朵同步接收一样的信息,通过大模型能力进行处理,给到用户有参考价值的结果。
在经历了 11 年的沉寂之后,AR 眼镜终于迎来了一个「翻身」的机会。对 AI 行业来说也是一样。毕竟当下大模型发展的一大难题,就是所有公司都在卷参量和规模,而罔顾了应用场景、效率和成本。想要实现成功的应用、商业转化,大模型必须进行更细的场景划分,与产品更紧密结合。
这种新的硬件范式与新的大模型能力结合,带来的全新使用场景,将不只改变雷鸟一家企业的命运。就像 iPhone 和 App Store 开启了整个移动互联网数代一样,AR + AI 有潜力颠覆的,将会是整个行业。