智能驾驶产品开发？先解决数据问题(上)

徐宏民
2022-08-30
分享
Line

各国的天候、地貌、道路规划、号志规则大不相同，数据难以通用。

先进驾驶辅助系统(ADAS)或是未来大家期盼的全自驾(两者统称为「智能驾驶」)，都是接下来新兴造车产业关键性的产品，DIGITIMES的研究也显示相关产品如感应器、镜头、线材、MCU、AI芯片、软件、服务等的营业额以及成长性都相当可观。

智能驾驶技术一般区分为4个技术模块：感知，理解环境重要的物件、移动方向、速度、行驶路径等；预测，掌握周边物件的未来移动轨迹；规划，决定短时间前进的最佳路径；控制，直接控制油门、煞车、方向盘等。

训练(及测试)数据在智能驾驶中具关键的角色，而且众多研究显示，量级多寡与正确率以及稳定度相关。数据除了用来训练「感知模块」(一般以视觉为主、雷达为辅)所需的标注外，同时也是「验证及确认」(verification and validation；V&V)程序中关键的元素； V&V用来确保智能驾驶产品功能安全，其同时也需要大量驾驶场景(scenarios)。而这些感知、V&V数据的取得，耗费人力与时间成本相当高，而且深具挑战。

智能驾驶3D数据的标注耗时费力。在智能驾驶的感知、路径预测、以及规划当中，需掌握物件在空间(立体)环境中的精确位置，所以必须标定空间中的长宽高以及中心点。一般3D的标注工具不方便使用，研究指出，3D数据的人工标注更加耗时，所需的时间为2D数据标注的2~16倍。

跨区的数据使用也有其限制。能否将甲地的数据使用在乙地？比如在欧洲收集以及标注的数据使用在美国？研究显示有其局限性。几个原因，各区域的物件种类、分布不同，如美国的皮卡、台湾的摩托车，远高于其他地区；另外，经过几个数据集分析，一般美国车的大小高于欧洲车。当然可以想见天候、地貌、道路规划、号志规则也大不相同。此外各地的驾驶习惯也有想当大的差异：车辆密度、以及路况的反应，例如遇到前侧方打方向灯时，各地区的驾驶反应大不相同。

建构3D动画，模拟生成的数据存在应用领域差异的问题。既然收集标注不易，那就使用3D动画生成路况，直接掌握各个物件、环境参数。但是真实场景的生成程序繁琐，通常产生的路段、场景有限，不具多样性。另一个更具挑战的是Sim2Real的障碍：模拟场景(simulation；sim)所训练出的AI演算法，在真实环境中(Real)同样会因跨域(cross-domain)的问题而大打折扣，因两方的光影、材质、线条风格等差异颇大，3D动画很难成为主流数据。

特殊物件以及场景的稀少性是另一个挑战。比如各地都有造型特殊的交通工具，可能在训练数据中未曾出现，在识别当下常被忽略，比如一台倒在路面只看到白色车厢顶的货车、特殊造型工程车等。更多的是各种少量的驾驶边角场景，一般难以收集，例如临时封街办流水席、深夜一头牛冲上高速公路等。少量边角案例常造成智能驾驶的安全事故，并已有多起案例发生。

数据取得成本高，那可以考虑少量样本技术(few-shot learning)吗？这些技术一般针对数据取得不易的医学或是工业应用，而且预期会在类似的工作中转换。相关技术对于精度以及稳定度标准高的车辆感知与控制，一般不会采用。

看到这麽多数据取得的挑战，难道就限制智能驾驶技术的发展？无法商品化？当然不是。除了耗时、投入大量资金采用全人工标注之外，在工程以及学术上，已经证实有些方法可以大大降低数据标注的成本，后续的文章，我们再继续探讨可能采用的数据策略。

徐宏民
台大资工系教授

徐宏民(Winston Hsu)现任富智捷(MobileDrive)技术长暨副总经理以及台大信息工程学系教授。哥伦比亚大学电机博士，专精于机器学习、大规模影像视讯查找与识别。为讯连科技研发团队创始成员，慧景科技(thingnario)共同创始人，NVIDIA AI Lab计划主持人；曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会；十余年产学合作及新创经验。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸识别冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。