
探索 BEV 方法用于全局定位
2023 年 6 月、7 月,「ICCV 2023 计算机视觉国际大会」与「IROS 2023 智能机器人及系统国际会议」陆续放榜,毫末智行人工智能中心技术团队提交的两篇论文入选。
ICCV 与 IROS 是人工智能与计算机视觉领域的两座顶级学术殿堂。其中 ICCV 则是计算机视觉领域的顶级会议之一,与 CVPR、ECCV 并称计算机视觉三大顶级会议。IROS(IEEE/RSJ International Conference on Intelligent Robots and Systems,IEEE/RSJ 智能机器人及系统国际会议)属于国际上机器人智能系统领域最著名、影响力最大顶级会议,由享誉盛名的 IEEE(Institute of Electrical and Electronics Engineers,美国电气与电子工程协会) 和日本机器人联合会联合主办。
此次毫末智行团队提交的《BEVPlace:Learning LiDAR-based place recognition using bird's eye view images》(《基于鸟瞰图投影网络的点云地点识别方法》)成功入选 ICCV 2023。论文《BEVPlace》探索了基于 BEV 图像的神经网络方法用于全局定位的潜力,基于等变网络设计了一个名为 BEVPlace 的旋转不变网络。得益于 BEV 图像的表征能力和旋转不变性设计,BEVPlace 方法实现了高召回率、强泛化能力和对视角变化的鲁棒性,在多个大规模数据集下的实验表明,BEVPlace 的性能超过了现有方法。此外,观察到几何和特征距离是相关的,并基于统计信息为位置估计进行了相关性建模。该模型同样可以适应其他定位方法,而 BEVPlace 给出了更准确的位置估计结果。
《I2P-Rec:Recognizing images on large-scale point cloud maps through bird'seye view projections》(《在大规模点云地图中使用鸟瞰图投影识别定位相机图像》)入选 IROS 2023。论文《I2P-Rec》研究了如何在点云地图中定位图像的问题,从工程应用角度和科研角度都具有较高的研究意义。I2P-Rec 利用深度估计算法从图像中恢复点云以消除模态差异,进一步使用 BEV 投影以进行全局特征提取。虽然 I2P-Rec 所使用的策略很简单,但在公开数据集上的结果表明该方法具有很强的地点召回能力和良好的泛化性能。
(BEVPlace 和 I2P-Rec 在小魔驼中应用)
毫末两篇论文成功入选这两大殿堂级顶会,再次彰显了毫末的深厚 AI 技术实力与积累。同时,两篇论文方法均已落地小魔驼等业务,来攻克技术难题。
毫末的技术能力一直被行业评价为中国版特斯拉,它们都采用了大模型、大数据和大算力的方案,以及重感知技术路线。今年 4 月,毫末发布了行业首个自动驾驶生成式大模型 DriveGPT 雪湖·海若,并受邀成为「北京市通用人工智能产业创新伙伴计划」第一批模型伙伴观察员。DriveGPT 雪湖·海若还被选为北京市首批人工智能 10 个行业大模型应用案例之一。
成立三年多以来,在自动驾驶公司中,毫末稳居「中国量产自动驾驶第一名」。在乘用车领域,毫末 HPilot 已搭载至魏牌、坦克、欧拉、哈弗等近 20 款车型;毫末推出的行业首个重感知城市 NOH,已在北京、保定、上海等城市落地,并在更多城市开启泛化测试。在末端物流无人配送领域,近期重磅发布的小魔驼 3.0 是毫末第三代末端物流自动配送车,也是全球首款 9 万元内中型末端物流自动配送车。小魔驼 3.0 适配灵活, 容量大, 可以满足在物流, 商超、零售等众多场景的需求。截止目前,小魔驼配送订单量即将超过 20 万单。