大模型上车:小鹏汽车的技术进击

摘要

科技路线的新飞跃。

近日,小鹏汽车举办了主题为「开启 AI 智驾时代」的 AI DAY 活动,展示了其在 AI 领域的最新进展,并宣布将全面推送 AI 天玑系统。这次系统更新将覆盖所有在售的小鹏汽车车型,并开始开始逐步推送。

去年,小鹏汽车在 1024 小鹏科技日上发布了第五代智能座舱系统——XOS 天玑系统。当时,这套系统由小鹏团队从零开始打造,主要实现了一些基础功能。然而,此次推送的 AI 天玑系统在应用最新 AI 技术的基础上,考虑了用户的反馈和需求,做出了许多改进,并覆盖更多车型。

长期以来,自研智能驾驶技术被认为是一笔不划算的买卖:尽管投入大量资金和人力,但由于技术更新迭代速度过快,有部分公司虽然取得了一定领先优势,但并不明显,甚至有的公司自研产品甚至不如供应商方案。

然而,大模型的出现,正在驱动自动驾驶的革命。小鹏汽车董事长何小鹏表示,在自动驾驶领域,大模型技术正引发一场颠覆性的变革,而不仅仅是量变的升级。「过去,我一直认为中国实现全无人驾驶还需多年。然而,今年以来,我们开始将端到端大模型应用于自动驾驶测试,所收集的数据让我相信,真正的全无人驾驶时代即将到来。」

AI 天玑系统登场

其实,在汽车领域,很多车企都在考虑如何应用大模型技术,最常见的就是座舱领域的绘画和百科全书等功能。然而,小鹏汽车认为,AI 的应用范围应该不止于此,他们更专注于如何更好地利用大型 AI 模型来改善用户的驾驶体验和车辆控制。

对于本次发布会上全量推送的 AI 天玑系统,小鹏官方的介绍是行业首个推出的全新 AI 车载操作系统,也是行业首次将 AI 技术全面应用于智能座舱与智能驾驶的操作系统。

AI 天玑系统带来的差异化体验 | 图片来源:小鹏汽车

在智能座舱方面,小鹏汽车采取了一些与其他竞争对手不同的举措。首先,他们改变了语音唤醒的方式。以往,小鹏汽车的语音助手需要一个特定的唤醒词,比如「你好,小 P」,然后才能开始对话。但现在,用户可以像和朋友交流一样来唤醒它,比如可以说「这里很闷,小 P」,而不用说「你好,小 P」,它也会理解你的指令。这种更自然的唤醒方式,让用户体验更加顺畅。

同时,AI 的加入还带来了更强的理解能力和需求推理能力。举个例子,当用户说车里有点闷时,它会意识到你想开窗户;再比如当用户说「我腰疼,小 P」时,它知道你需要打开座椅按摩功能;或者当你说「空调有点吵,小 P」时,它会降低空调的风速。这种语音理解能力的提升,让用户在驾驶中更加便利。

在智能驾驶方面,小鹏已经迈出了端到端的重要一步。在智驾的通用性方面,小鹏正在加速拓展。目前,小鹏智驾的「开城」数量、可用里程达到行业头部,「开城」速度持续提升。2 月份,小鹏汽车宣布面向智驾经验用户推送无限 XNGP 智能辅助驾驶功能,不限城市、不限路线,全国都能开。

接下来,何小鹏表示,计划在 2024 年第三季度实现全国范围内的智能驾驶覆盖,到 2025 年则朝着城区智能驾驶与高速智能驾驶体验同步发展的目标迈进。

小鹏汽车此前提到的「AI 代驾功能」落地 | 图片来源:小鹏汽车

除此之外,小鹏还希望给用户提供个性化体验。AI 代驾是业内首个实现「点到点」超长记忆导航的量产系统。据介绍,这个系统只需学习一次就能为用户生成定制化的驾驶路线,从而提供全程智能辅助驾驶体验。每个用户最多可以存储 10 条记忆路线,每条路线最长可达 100 公里。

另外,小鹏的 AI 泊车技术也引人注目,可以实现免遥控离车泊入和迎宾出库功能。无论是侧方位停车还是复杂车位,这项动作都能自动完成,大大提升了泊车效率和速度,用户还可以通过手机 APP 轻松控制整个停车过程。

很多人可能会有疑惑,小鹏的智驾将在三季度实现全国每条路都能开,那为什么还要推出 AI 代驾呢?对此,小鹏汽车自动驾驶负责人李力耘表示,尽管通用模型的能力日益增强,能够提升体验、效率、舒适度和安全性,但这与小鹏的 AI 代驾和 AI 泊车并不矛盾。小鹏汽车非常重视客户的个性化体验,其 AI 代驾和泊车系统能够根据用户的生活习惯、城市环境、通行路线和停车习惯进行自我调整。

端到端大模型量产上车

在这背后是,AI 大模型正在带来革命性的变革。李力耘表示,「AI 大模型的强大之处在于能够在不确定性和复杂的环境中找到最优解。此外,借助先进的模型架构和系统,AI 还能自我进化和学习,尽管需要一定的指导,就像教育孩子一样。这种自我提升能力是 AI 提高上限的重要因素。」

小鹏城区智驾发展的三个阶段 | 图片来源:小鹏汽车

以前,智能驾驶的代码,主要是采用规则写规划、控制来实现。但即使写了成千上万行代码,也只能实现有限的规则能力。而现在,大模型技术的发展,使得端到端方案在准确性和安全性方面有了巨大的提升,为智能驾驶技术的发展提供了便利和优势。

目前,小鹏汽车在智能驾驶领域取得了重大突破,推出了国内首个量产上车的端到端大模型系统,它包括深度视觉感知神经网络 XNet、规划大模型 XPlanner 和大语言模型 XBrain,它们分工不同:

• XBrain:更像人类的大脑,为智能驾驶系统提供了理解和学习能力。它能够处理复杂场景,快速响应各种驾驶环境中的指令。XBrain 可以识别待转区、潮汐车道、特殊车道和路牌文字,并根据这些信息做出安全高效的驾驶决策。

• XNet:类似于人类的眼睛,是一个结合动态视觉、静态视觉和 2K 纯视觉技术的深度感知神经网络。它能够以裸眼 3D 效果重构现实世界的 3D 图像,感知范围扩大了两倍,相当于 1.8 个足球场的面积,并能识别 50 多种目标物,使驾驶系统的视野更加清晰、广阔。

• XPlanner:更像人类的小脑,是基于神经网络的规划大模型。通过大量的数据训练,它逐渐进化出类似人类驾驶员的操作能力,使驾驶过程更加平稳,提升了用户的驾驶舒适性和安全性。

尽管大模型和神经网络在自动驾驶中扮演重要角色,但并不是说端到端的自动驾驶系统完全依赖神经网络。相反,自动驾驶是在一个完整的体系中完成的。小鹏将其类比为人类这个最强大、最普适的 AI 系统。他是由眼、耳、口、鼻、大脑、小脑和运动神经等组成,尽管各部分功能有所重叠,但分工明确。

为此,小鹏汽车提出了 XBrain、XNet 和 XPlanner。这些系统既有联系,又各司其职,能够极大地提升 AI 智能驾驶的能力上限。其中,XBrain 侧重于整体场景的认知,而 XNet 侧重于感知和语义,在工作的时候它们是紧密协调的。

在工程实践中,每个部分的侧重使小鹏能更容易理解问题的来源,无论是理解错误、未能感知到信息,还是感知正确但操作错误,都能在实践中得到解决。这种系统性的理解和解决能力,是小鹏能够量产端到端大模型的关键。

未来,何小鹏预计,在当前硬件性能不变的情况下,仅通过软件升级,12 至 18 个月就能实现智能驾驶的重大突破。这种技术将颠覆许多传统自动驾驶公司,特别是随着高级自动驾驶和无人驾驶的普及,智能辅助驾驶技术不再能单凭简单的软件功能销售,而是需要承担高昂的数据成本。

何小鹏预计未来 18 个月,智驾能力提高 30 倍 | 图片来源:小鹏汽车

这份底气来源于对技术创新的执着,以及对长期战略的坚持。何小鹏表示,今年的研发投入将达到约 70 亿元。同时,这种投入不仅要看规模,更要关注效率和成功概率。他认为,只有坚定地进行研发投入,企业才能取得突破。

尽管新能源汽车市场自 2019 年以来经历了波动,但这并不影响企业的整体实力和长远战略。何小鹏表示,短期销量并不能完全反映企业的真正价值,关键在于持续的技术创新和研发投入。

小鹏汽车最新推出的 AI 天玑系统升级,只是其「AI 定义汽车」战略的开始。小鹏已经找到了有效的方法论,并成功实现了每两天一次的内部 OTA 更新循环。这些举措将在未来显著拉开小鹏与竞争对手之间的差距,同时推动全自动驾驶时代加速来临。


 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。