-
毫末AI DAY:自动驾驶新时代的6大挑战
来源:
   日前,第六届HAOMO AI DAY正式举办。据悉,HAOMO AI DAY品牌日系列活动始于2021年,以季度为周期召开,用于展示当下自动驾驶领域最新趋势以及毫末智行最新发展动向。
   在活动中,毫末智行董事长张凯分享了当下智能驾驶领域的发展趋势。根据该企业提供的数据,2022年,中国市场在全球智能汽车份额中所占比例已达到57%,渗透率达到26%。相比之下,欧洲所占比例为27%;美国所占比例为10%。中国市场已呈现绝对领跑之势。
  
   而从国内数据来看,2020年-2022年6月,是中国市场各品牌高级别辅助驾驶功能搭载的快速攀升时段,尤其是2022年上半年,高级别辅助驾驶的前装搭载率达到26.64%。据张凯预测,上述数据还将快速增长,预计到2025年,中国高级别辅助驾驶搭载率超过70%。
   市场繁荣可期,但竞争也愈发激烈。一直以来,自动驾驶领域中都有着“渐进式”与“跃进式”两种发展策略。所谓“渐进式”策略,指的是优先量产L2级辅助驾驶、高级辅助驾驶,并由此低成本地获取数据,不断完善、迭代算法,最终做到L4、L5级别的自动驾驶。
   “跃进式”策略指跳过L2、L3,直接一步到位做到L4、L5级别自动驾驶。选择跃进式策略的大都以科技公司为主,比如谷歌旗下的Waymo,毕竟在不造车的前提下,这些科技公司也难以找到大规模量产车为其提供数据。
  
   在张凯看来,两种策略相比之下,渐进式才是推动人类实现自动驾驶的最佳路径。“首先,渐进式路线量产时间更早,能够更早形成规模化。相对跃进式路线,渐进式更容易获得足够数量的数据。其次,渐进式路线是从用户真实使用场景中获得的数据,相对跃进式定向采集数据方式而言,成本更低,质量更高。”
   而在渐进式策略中,成功的关键就在于数据。背靠长城汽车这种规模庞大的主机厂,毫末智行的规模化落地存在一定地保障性。为了更好发挥庞大数据优势,对车辆所产生的数亿自动驾驶里程的数据进行智能分析,以支持更大规模的应用。毫末智行于2021年底发布了自动驾驶数据智能体系——雪湖。
   据毫末智行CEO顾维灏表示:“目前用户使用我们辅助驾驶产品所产生的辅助驾驶里程,已经接近1700万公里;我们的数据智能体系MANA的学习时长已经超过了31万小时,虚拟驾龄达到4万年。末端物流自动配送车也为附近用户运送了超过9万单的物资。数据的规模和多样性都在快速地增长。”
  
   除路线之争外,毫末智行也将自动驾驶技术发展分为了三个阶段:硬件驱动时代、软件驱动时代以及数据驱动时代。在硬件驱动时代,车辆被武装到牙齿,感知能力的强弱往往取决于谁的激光雷达数量多、线束多。但由于整体成本高,导致量产车型有限,自动驾驶里程规模较少。
   随着更大算力的中央计算芯片,自动驾驶也走入了软件驱动时代,AI在车上开始广泛应用。在感知方向,各个传感器各自为战,用一些小模型和少量数据做训练,得到单个传感器的识别结果,然后进行感知结果级的融合;在认知方向,则依旧以人工规则为主。在此阶段中,整体成本逐步下降,效果则逐渐提升,自动驾驶里程也迅速提升,达到上千万公里。
   如今,自动驾驶领域已开始进入3.0时代——数据驱动时代。“数据驱动时代,是完全不一样的时代,是数据自己训练自己的时代,我们所做的一切的,都是为了能够做出数据通道和计算中心,以便可以更高效的获取数据,并把数据转化为知识。在感知方向,是用多个传感器、不同模态传感器的原始数据联合输出感知结果;在认知方向,通过大量人驾数据抽取可解释的场景化驾驶常识,在配以AI的实时计算,可以更加拟人化的融入社会交通流中;训练的方式,也发生了很多变化,主要是从小模型少数据,转成刚才提及的大模型和真正的大数据,是那种1亿公里以上的辅助驾驶里程所产出的数据。”
  
   目前,毫末智行正在加速进入数据驱动时代,摆在这家企业面前的则是新时代的六大挑战。挑战一是如何在自动驾驶领域应用大模型。对此,业界常用的方式是监督学习。虽然毫末智行拥有自动标注的手段,样本标注的时间成本和金钱成本还是很高。在顾维灏看来,应对这一挑战的关键还在于能够直接使用大量无标注数据的方法,毫末智行选择的是将所有的感知任务backbone都统一,然后利用无标注数据先训练好这个统一backbone并锁定,模型剩余部分再用标注样本来训练。
  
   挑战二是存量数据规模巨大的前提下,如何让模型能够对新场景保持敏感,而不会陷入可怕的遗忘性灾难。为此,毫末智行构造了一个增量式的学习训练平台。在训练过程中抽取部分存量数据加上新数据组合成一个混合数据集。相比于用全量数据再次精细的训练模型,毫末智行,在同样的精度下可以节省80%以上的算力,收敛时间也可以提升6倍以上。
  
   挑战三是如何使用重感知技术解决空间理解问题。在顾维灏看来,城市场景里的道路环境发生变化的频率远远高于高速场景,如果把地图看作一个传感器的话,那么这个传感器的置信度是有些问题的,不知道什么时候什么地方它就会失效。所以毫末智行选择了重感知轻地图的路线,在城市实现导航自动驾驶只用普通导航地图,不依赖高精地图。
  
   为了提升自动驾驶系统的时空理解能力,毫末智行用时序的transformer模型在BEV空间上做了虚拟实时建图,通过这种方式让感知车道线的输出更加准确和稳定
   挑战四是如何让自动驾驶系统能够使用人类世界的交互接口。此前,业界做法是用传感器感知和算法预测周围交通参与者的意图。而在城市环境下,交通参与者的活动变得更复杂,预测的难度加大。为此,毫末智行升级车上的感知系统,加入了对车辆信号灯状态的专门识别,包括刹车灯和转向灯。以达到在前车减速,周围车辆切入等场景中开的更安全和更舒适。
  
   挑战五是如何让仿真更真实。在顾维灏看来,对于仿真,主要有三个层次的工作。一个是基础仿真能力,仿真环境和运动的基础能力,主要衡量的是精准性;一个构建场景的能力,主要看的效率;另一个定义场景的能力,主要看有效性。
   以城市路口的场景为例,毫末智行通过与阿里以及相关部门合作,利用路端设备将路口处每时每刻的真实交通流都记录下来,再通过log2world的方式导入到仿真引擎里面,加上驾驶员模型之后,就可以用于路口场景的调试验证。
  
   挑战六是如何让车运动起来更像人。毫末智行的做法是对覆盖海量人驾进行深度理解,构建毫末自动驾驶场景库,并基于典型场景挖掘海量司机的实际驾驶行为,构建taskpromt,训练一个基于时空Attention的驾驶决策预训练大模型,使得自动驾驶决策更像人类实际驾驶行为,以保证实现自动驾驶决策的可控、可解释。
- 兰博基尼
- 兰博基尼(Automobili Lamborghini S.p.A.)是一家意大利汽车生产商,全球顶级跑车制造商及欧洲奢侈品标志之一,公司坐落于意大利圣亚加塔·波隆尼(Sant'Agata Bolognese),由费鲁吉欧·兰博基尼在1963年创立。主要车型有Aventador、Huracan、雷文顿Reventon、盖拉多Gallardo、蝙蝠Murcielago等。
- 劳斯莱斯
- 劳斯莱斯(Rolls-Royce)是世界顶级的超豪华轿车厂商,1906年成立于英国,公司创始人为Frederick Henry Royce(亨利·莱斯)和Charles Stewart Rolls(查理·劳斯)
- 宾利
- 宾利(BentleyMotors Limited)是一家举世闻名的超豪华汽车制造商,总部位于英国克鲁。1919年,W.O.宾利先生创办了宾利汽车公司
- 宝马
- 宝马(BMW)是享誉世界的豪华汽车品牌。宝马的车系有1系、2系、3系、4系、5系、6系、7系、i系、X1、X2、X3、X4、X5、X6、X7、Z4等几个系列,还有在各系基础上进行改进的M系(宝马官方的高性能改装部门)。宝马公司创建于1916年,总部设在德国慕尼黑。BMW的蓝白标志宝马总部所在地巴伐利亚州州旗的颜色
- 法拉利
- 法拉利是举世闻名的赛车和运动跑车的生产厂家,总部位于意大利马拉内罗(Maranello),由恩佐·法拉利(Enzo Ferrari)于1947年创办,主要制造一级方程式赛车、赛车及高性能跑车。法拉利品牌法拉利所使用的传奇标志有着非同寻常的起源
- 特斯拉
- 特斯拉(Tesla),是一家美国电动车及能源公司,产销电动车、太阳能板、及储能设备。 总部位于美国加利福尼亚州硅谷帕洛阿尔托(Palo Alto)。 特斯拉第一款汽车产品Roadster发布于2008年,为一款两门运动型跑车
- 奔驰
- 梅赛德斯-奔驰奔驰,德国百年汽车品牌,汽车文明的先驱者与引领者,被认为是最成功的高档汽车品牌之一,其登峰造极的技术水平、精湛过硬的质量标准、推陈出新的创新能力、以及一系列经典轿跑车款式令人称道,车系有A级、B级、C级、CL级、CLK级、E级、S级、SL级、SLC级、SLK级、SLR级、G级、GL级、GLK级、M级、R级、AMG车系等。
- 保时捷
- 保时捷(Porsche)是一家德国汽车生产商,又叫波尔舍,总部位于德国斯图加特,是欧美汽车的主要代表。主要车型有911、Boxster、Cayman、Panamera、Cayenne、Macan。1931年,保时捷成立于斯图加特,以生产高级跑车闻名于世界车坛