8 月 21 日,在 42 号车库出品的播客栏目《无限不可能引擎》中,毫末智行的副总裁蔡娜与 42 号车库创始人大吉进行针对智驾产品如何从技术走向落地进行了深度交流。
「毫末做产品的第一性原理,是从产品到商品再到用品。目前毫末的城市 NOH 产品与竞品最大的差异化就是成为大部分用户能够去使用的用品。」8 月 21 日,在 42 号车库出品的播客栏目《无限不可能引擎》中,毫末智行的副总裁蔡娜与 42 号车库创始人大吉进行针对智驾产品如何从技术走向落地进行了深度交流。
在一个多小时的访谈中,作为一位在智驾领域深耕十年的大牛,蔡娜结合自己的从业经历,带领大家了解一项新技术是如何逐渐实现产品落地的,详细阐述了毫末在技术路线选择和产品设计中最底层的逻辑思考,同时也对行业当前的发展做出了解读。
一起来看看专注投入自动驾驶领域十年,是一种什么样的感受。
「我的职业生涯几乎每天都在做产品经理,产品经理一直在做最困难的两件事」
在前一份工作中,蔡娜经常被人开玩笑的叫做「demo 女王」。用蔡娜自己的话解释,就是「为全球几乎所有主机厂做过 demo」。蔡娜调侃,不知道这算有幸还是不幸。那时的自动驾驶,大多停留在参赛的 demo 阶段。蔡娜认为,这源于很多主机厂和自动驾驶公司思路差异。
早期,主机厂是从技术领先性的角度去考虑自动驾驶的。「大家总觉得移动的方式是会被改变的,现在是人开,后续方式是车上智能化」,因此主机厂会更注重流程,会为自动驾驶定很多分级去适应法规要求。这就导致主机厂很少去考虑自动驾驶在应用性上的价值。后来的自动驾驶公司,则更多是采用产品思维。首先考虑的是自动驾驶产品应用场景——高速、城市、单车道巡航还是变道。思考维度的不同,造就了以产品思维去思考的自动驾驶公司走得更快一些。
「我的职业生涯几乎每天都在做产品经理的工作。」在蔡娜看来,「产品经理其实一直都在做最困难的两件事——把我的思想放在你的脑子里,把你的钱放在我的口袋里。」如果要量产,产品经理的角色必不可少。当产品量产,面对千千万万用户时,把他们的需求做聚类,就是产品经理最大的价值。而产品经理自身,在蔡娜看来,是需要终身学习的,「我这个模型里也有很多 Corner Case,需要给自己增加更多的数据训练。原来的那波数据已经都沉淀得比较好了,就需要新的。」
目前,毫末 HPilot 已搭载至魏牌、坦克、欧拉、哈弗等近 20 款车型,截至 2023 年 7 月,毫末用户辅助驾驶行驶里程突破 7000 万公里。毫末推出的行业首个重感知城市 NOH,将首批落地北京、保定、上海等城市,并开启泛化测试。
「不是量产数据往那一堆,数据闭环就自然从天而降」
从产品经理的角度出发,蔡娜带领团队研发了场景数据库。「我们现在有个 CSS(Cooperation scenario safety 协同场景安全)自动驾驶场景库数据,在什么样的交通密度之下,有多少车道,车和障碍物状态之间是什么关系……面对这些连续性的切片化场景和连续化的动作组合,通过量产数据积累的场景数据库,能够让毫末的认知更细节化、更颗粒化、更场景化。」
对于如何形成更良性的数据闭环,蔡娜也指出了 3 个关键:足够的数据量、线上化率与售卖车辆、大模型。「这三个事情都要有,不是量产数据往那一堆,数据闭环就自然从天而降。」
首先,要有足够多的量产数据。其次,要做在线化,保证很高的在线化比例,「车企和手机不一样,能做在线化的公司凤毛麟角。」最后,是通过大模型来喂养这些数据,通过一套充分匹配的机制打造从数据到模型之间的闭环。
除了数据闭环,车企和经营商在智驾领域的合作模式是否会一直存在也是行业一直在讨论的问题。蔡娜认为,和车企的深入关系对于自动驾驶企业来说至关重要。自动驾驶是科技性很强的能力,一口气同时服务很多家企业不太现实,「一定是深入跟几家主机厂合作,稳扎稳打把技术应用到车上,这是非常重要的事。」
蔡娜指出,毫末的一个大客户是长城汽车,长城汽车旗下有各种不同类别、不同定位的车型和品牌,这也让毫末 HPilot 成为唯一覆盖电车、油车、混合动力车型的辅助驾驶产品。以魏牌蓝山为例,蓝山 7 月销量超过 5500 台,整体服务 17000 多个家庭。「我们为这些车主提供自动驾驶服务,解放了驾驶员的疲劳,为 17000 多个家庭保驾护航,这就是我们提升的价值。」
「给 L4 更多空间,有一天我们可以在未来重逢」
2023 年被行业称为「城市 NOA 元年」,各家城市导航辅助驾驶产品纷纷开始推进,之所以能形成这种「百家争鸣」的情况,很大程度上要取决于「重感知路线」的加持——在行业玩家纷纷甩开高精地图这根「拐杖」后,大规模泛化成为可能。
作为中国「重感知」路线的最早玩家,毫末在 2020 年底立项城市 NOH 的时候就通过第一性原理确定了重感知技术路线,彼时,行业基本都还在采用英伟达 Orin 芯片+高精地图技术路线。对于这个问题,蔡娜给出的解答也很简单,因为高精地图的覆盖问题决定了它只能在局限城市的局限区域里实现,而毫末的核心考量是让城市 NOH 成为大部分用户能够去使用的用品。
在国内自动驾驶领域,毫末是率先引入 Transformer 的公司,今年 4 月,毫末还发布了业内首个自动驾驶生成式大模型 DriveGPT 雪湖·海若。
谈到如今城市 NOA 热门的「通勤模式」路线需要花多长的时间训练出来?蔡娜给出了完全不同的看法。在她看来,所谓通勤模式,更多的是打了一个概念,每个人的通勤路线都不一样,「如果我这个城市没开通,肯定会存在你行我不行,或者我行你不行的状况。对用户来说,是不公平的」。
「聪明人把好做的事都做了,一定会进入深水区。进入深水区,前面的积淀就很重要。」在蔡娜看来,毫末的标准是要做用品,这就要求产品无差别的覆盖,适用范围、公里数、场景都需要尽可能多的实现覆盖。「我们也在逐渐去理解各个城市,进入深水区,为的就是推进更好的用品,而不是让用户去体验一段路的 demo,如果按用品的标准来看,毫末在业界里算是推进速度很快的。」
当谈到自动驾驶的最终形态——自动驾驶会走向 L4 吗?蔡娜表示「L4 一定会到来。」对于这个时间,蔡娜给出的判断是「至少 10 年」。
在她看来,技术想要更成熟,就要肩负从技术到产品、从产品到商品,最后从商品到用品的漫长路径,而目前 L4 还没有打通从产品到商品的路径,还没有办法被更多的人使用,所以「L4 的路还很长,需要更多的人付出更多的青春需推助它成功。」
同时,蔡娜也表示,不要拿商业化的枷锁去禁锢一个更需要长线的东西,L4 离商业化还很远,是一个更长远的技术探索之路,所以「应该给 L4 更多的空间和喘息余地,让它只做这一件事,有一天我们可以在未来重逢。」
「最难落地的城市是下一个城市,城市 NOA 的终极形态是任意门」
当前,城市导航辅助驾驶处于爆发前夜,随着高速场景的完善,差异化越来越少,辅助驾驶开始进入城市场景。当聊到实际落地的过程中,遇到的技术瓶颈或者工程化落地的瓶颈,蔡娜直言,「未来很长,城市工况远比我们想象的要复杂」。
一方面,每个城市的建设、规则、人类开车行驶风格都不相同。另一方面,毫末团队在实际落地推进中发现,并不是每个城市都完全依照国家规定的道路建设标准去建设,「比如我们最常见的红绿灯是红黄绿三筒灯,但也有五筒灯、汉字灯、三角灯……这些奇奇怪怪的灯都会影响到自动驾驶的推进。」此外,例如路边违停、车道线的重画/更新等对于城市导航辅助驾驶来说都是考验。「城市的这一仗刚开始,大家未来几年还有得玩。」
而面对「无图」究竟是什么?当前又存在几种方案呢?覆盖一个城市又需要多久的时间呢?最难的城市是哪一个?这一系列大家既熟悉又陌生的提问时,蔡娜同样从第一性原理出发,给出了自己的看法。
在她看来,所谓的「无图」,本质上是少图方案,从高精地图到 SD-PRO 再到 SD,是一个地图元素越来越少的过程。元素越多,对系统和感知的要求就会越低,这也是起初很多玩家采用高精地图方案的原因。但随着城市导航辅助驾驶的量产,商品开始转变为用品,用品的特点是要被更多用户在更多时间去使用。而高精地图由于覆盖城市数以及覆盖城市道路等级的问题,显然无法满足用品需求。
「核心还是要让更多的用户去使用,所以肯定是无差别开放,至少要对 80% 的用户相对公平,公里数、开放范围、覆盖城市等要保持一个水准才可以。一两条线路,甚至是十几、二十公里,肯定是不行的。」所以基于第一性原理,「我们要打破这件事,要更多覆盖购车用户,要让用户上车的时段大部分是可用的,基于这两点,我们选择重感知的方案,让地图尽量轻量化。」
面对主持人「到今年年底,开通几十个城市的智驾是有希望的吗?」的提问,蔡娜认为城市导航辅助驾驶是「开城容易守城难」。因为从研发流程来看,有一台车跑出一个标准路线,城市就可以算开放。这就跟早期的高速导航辅助驾驶类似,可能起初并不好用,随着它的演进、数据闭环的更迭,才会变得越来越好用。
因此,城市导航辅助驾驶「数量不是问题,这个数量下的质量才是问题,我们也许很快就会开 100 个城市甚至更多,但是要把这些城市落地的产品能够完全的跟人驾更好的去配合,甚至是能够真正做到释放精力,这些是后面探索的更长的路径。」
同时,城市导航辅助驾驶的落地,会是一个越来越快的过程。因为它会随着数据的积累。随着各类问题的逐渐解决而不断得到完善。「前面几个城市是最难。就跟小孩学习一样,幼儿园你会发现三年也没学啥,等你上大学,一节课学的可能都比幼儿园一年学的还多。」但是随着系统对于城市的理解越来越深,数据积累的越来越多,模型、分类越来越完善,就会很快聚类出新产品,然后就迅速开放。
从一个产品经理的角度去看待自动驾驶技术发展,蔡娜认为核心是泛化。「如果我们想无差别的对用户,泛化能力就很重要。」而诸如红绿灯识别这类的感知技术、如何让产品跟得上城市道路变化速度的更新难题;如何在更多平台推进产品的商品化甚至用品化,这些都是泛化尚需解决的难题。
而当大吉问道「你们现在碰到最难落地的城市是哪个」时,蔡娜直言「下一个城市。」
「大家经常问我自动驾驶终极形态是什么?我觉得终极形态是任意门,终极嘛。但通往任意门的路程就会很远,觉得在我的职业黄金期里可能会很难看到了,也许我的后辈们会见证它。」随着人工智能的快速发展和一系列利好政策的不断加持,我国自动驾驶技术进入全场景落地阶段,产业潜力不断迸发。从第一性原理出发,发挥大模型、大算力、大数据时代的技术创新,毫末正在努力打造「让机器智能移动,给生活更多美好」的共同愿景,一步步的向着自动驾驶的「任意门」进发。
大家如果想了解更多蔡娜的观点和关于城市 NOH 的故事,可以登陆哔哩哔哩、喜马拉雅、小宇宙、PODCAST 等平台,搜索「42 号车库」、「无限不可能引擎播客」,收听收看相关节目,让自动驾驶领域深耕十年的资深大牛,带你了解智驾如何从技术走向产品落地。
来源:搜狐网