为什么所有车企，都说要成为AI公司？

「一家成功的智能电动汽车公司，一定是一家成功的 AI 公司。」

这是汽车领域近两年最时髦的一种表达，最近一次出自蔚来 CEO 李斌之口。李斌如今常常把企业家、投资人等一系列头衔藏起来，以自媒体人自居，核心目的是要让更多人了解一个真实的蔚来，不能因为过往被打上了「服务好」的标签，就认为蔚来技术不好。

他说：「创新才是蔚来的底色。」

有过类似的表达的不只有蔚来一家。过往每家汽车公司都会有自己的标签，例如操控感、豪华感、动力感、经济性……但现在，大家有了一个新的共识：给自己贴上 AI 的标签。

李斌和秦力洪分享蔚来在科技创新领域的最新思考 | 图片来源：极客公园

让汽车变得更聪明，是第一个关键问题，也是车企们现阶段需要尽快向用户展示的重要能力。

但「变聪明」这三个字，本身又是一个很难量化的描述。怎样才是一个聪明的机器呢？OpenAI 的首席技术官 Mira Murati 曾经试过在一档播客节目中，用人类的智力水平类比过 AI 模型的能力：GPT-4 相当于聪明的高中生，而 GPT-5 有望达到博士的水平。

这种说法虽然通俗易懂，但其实很难直接套用在汽车上。因为比起大模型本身，智能汽车作为一个巨大的智能硬件载体，不仅要有「智力」理解问题，还要通过具体的「能力」解决问题。

如果把智能汽车比作机器人，那么这个「人」变聪明的过程中，需要一个「聪明的大脑」——不仅要拥有模型本身的智力；还要负责为「身体」制定一套合理的任务管理和分配体系，以确定不同「器官」需要在不同时候按怎样的优先级处理一系列不同的任务。

举个例子：主动悬架是这两年很火的新功能，其核心就是根据记忆和计算，让车辆在行驶过程中对悬架参数进行调节，以应对不同路面的颠簸程度，带来更好的驾乘体验。这涉及到了底盘、智驾等不同领域之间的配合。如果没有一个统一的大脑协调，由于带宽、延时等技术问题，配合就容易不协调，达不到想要的体验。

7 月 27 日，在 2024 NIO IN 蔚来创新科技日上，蔚来发布了「整车大脑」——整车全域操作系统 SkyOS。这代表着蔚来对于 AI 时代的思考：据介绍，基于这一系统，可以在跨域任务执行、算力分配等方面提供更好的体验。

而这些努力都是为了同一个目标：让智能汽车变得更聪明。

世界模型，让智驾「会推理」

智能驾驶是 AI 上车关注度最高的场景，也是近年来技术路线变化最快速的一个领域。

过去几年，智驾经历过几次技术路线的迭代，既有从高精地图方案切换到无图模式，也有以特斯拉为代表的部分公司尝试纯视觉（去激光雷达）路线。

但这些路线的切换，本质上只是为了降本，并没有改变智驾「规则驱动」的本质。这个系统依然需要大量的程序员花心思写代码，改 BUG。换言之，这只是人类通过编程语言，把自己对于驾驶的认知翻译给机器的一个过程，智驾系统本身并没有产生智能。

端到端技术的出现，改变了这一套规则。规则驱动正在向数据驱动演进，人类试图复制在大语言模型领域里已被验证成功的 Scalling Law，通过投喂大量视频数据，把智驾系统训练成一个可以涌现出智能的神经网络大模型。

这种模式的最理想结果，是马斯克曾经描述过的人类驾驶思考模式，即：输入视频（看到的路面信息），输出控制（踏板及方向控制）。

端到端的智能驾驶架构图 | 图片来源：蔚来

套用「AI 三大基石」的理论，要达到这一目标，需要解决算力、算法、数据三大关键问题。

蔚来在数据上采取了「群体智能」的方式，即：基于大量预装高算力、高配感知硬件的量产车获得大量真实数据。据介绍，

算力则更是一个外部问题，并不由车企自身决定。

所以，下一阶段的重点，是从算法本身出发，提高模型自身的训练效率和推理能力。蔚来给出的下一个答案是：世界模型（Nio World Model，以下简称 NWM）。

你可以把 NWM 看成是 Sora 的一种变体，某种程度上也是一个视频生成的产品。略有不同的是，Sora 主要依然基于「文生视频」，而蔚来的世界模型则是一种「视频生视频」：根据官方介绍，NWM 可以将 3 秒钟的真实驾驶视频作为提示词，生成最多长达 120 秒的视频。

蔚来将 NWM 的职责描述为「推演万千平行世界」 | 图片来源：蔚来

但视频生成显然不是蔚来的目的，蔚来也不是要用 NWM 生成的视频来做训练数据。

仍然用人类的思维模式做比喻：在一个人类司机选择超车前，TA 会根据实时路况判断左右不同的变道路线以及选择不同的超车时机。这一决策和推理的过程，NWM 通过一段生成的视频，具象地表达了出来。

根据官方介绍，NWM 能在 100 毫秒内推演出 216 种可能发生的场景，并找到最优解。

所以，NWM 的出现，实际是通过生成式 AI 这条技术路线，找到了智驾系统在新工作方式（端到端）下变得更聪明的新路径。

发掘座舱里的「人味」

AI在汽车上的另一个深度应用场景，就是智能座舱。

如果你曾经分别体验过一台“传统车”和一台“优秀的智能汽车”，你应该不会认为智能座舱里的种种功能只是花拳绣腿。笔者一直认为，在驾驶过程中，最安全的人车交互方式应该是通过语音——它可以保证你的视线和双手继续保持在对驾驶的关注当中。

可以说，在座舱智能化这件事上，具有互联网基因的造车新势力们显然已经走在了很多传统车企前面。

现在，当AI浪潮到来的时候，它们已经开始面对下一个选择，就像前阿里董事会主席张勇说的那样：

用AI的方法，把所有产品都重新做一次。

蔚来希望用AI重新定义人车交互的范式 | 图片来源：蔚来

就目前来说，蔚来基本把目前市面上主流的 AI 软硬件玩法，都搬到了车上。

例如 AI+音乐，通过 AI 加持的音质算法加成，为缺乏全景声的音源进行优化，再用车机自带的硬件进行播放。

停车守卫功能在 AI 加持下，则变成了一个类似视频会议纪要的产品。AI 会筛选生成值得关注的重点瞬间，如果不幸在停车时遭遇剐蹭等，这个产品就可以变成一个提效工具。

还有即将上车的旅行回忆功能。发布会现场显示了一段自驾游之后，根据车载摄像头捕捉的沿途风景自动剪辑生成的 vlog，其中还有一些标志性山峰进行了地点标注。类似的 AI 剪辑功能，过往在运动相机等场景有过应用，如今蔚来也把它搬上了车里。

除此之外，蔚来此次还展示了 NOMI 在多模态能力加持下的进化：可以看到「嘘」的手势，自动调低音量；也可以基于不同环境下，表达恰如其分的情感关心。

蔚来用「情感智能」描述了 AI 在座舱领域的进化。但在笔者看来，这些单一功能在 AI 本身的能力上并没有非常巨大的突破，反而是想到这些实际应用场景，并且落地上车的决策值得关注。在座舱领域里，也许目前应用场景的挖掘是先于模型能力进化的。

7 月 27 日晚上，结束了媒体采访的李斌几乎是马不停蹄地进入了又一场线上直播。和过往无数次在网上发声一样，他又遇到了一些或尴尬或尖锐的问题，他选择直接念了出来：

「别天天整抖音了，用心管理公司吧。」

李斌笑着解释这只是他第 5 次直播。但就像那些被藏进智能座舱里，也许现在使用率还不高的小巧思一样，他觉得蔚来在创新上的思考和努力是需要介绍给大家的，「不然大家每天都说蔚来服务好，就好像我们技术不好一样。」

索性，这样的表达收到了很多正面的反馈。李斌在媒体沟通会上自嘲道，以前大家说因为一个人（指李斌自己）不买一台车，现在也有很多人说要为了一个人买一台车，他很高兴自己能做到这一点。

一旁的秦力洪补充了一句：以前大家最期待的是年底的 NIO DAY（蔚来日，蔚来车主最大的活动），我们希望以后蔚来 NIO IN 可以成为媒体和车主最喜欢的活动。

期待这一天可以尽早到来。

世界模型，让智驾「会推理」

发掘座舱里的「人味」

最新文章