智能应用 影音
EVmember
ST Microsite

智能驾驶产品开发?先解决数据问题(上)

各国的天候、地貌、道路规划、号志规则大不相同,数据难以通用。

先进驾驶辅助系统(ADAS)或是未来大家期盼的全自驾(两者统称为「智能驾驶」),都是接下来新兴造车产业关键性的产品,DIGITIMES的研究也显示相关产品如感应器、镜头、线材、MCU、AI芯片、软件、服务等的营业额以及成长性都相当可观。

智能驾驶技术一般区分为4个技术模块:感知,理解环境重要的物件、移动方向、速度、行驶路径等;预测,掌握周边物件的未来移动轨迹;规划,决定短时间前进的最佳路径;控制,直接控制油门、煞车、方向盘等。

训练(及测试)数据在智能驾驶中具关键的角色,而且众多研究显示,量级多寡与正确率以及稳定度相关。数据除了用来训练「感知模块」(一般以视觉为主、雷达为辅)所需的标注外,同时也是「验证及确认」(verification and validation;V&V)程序中关键的元素; V&V用来确保智能驾驶产品功能安全,其同时也需要大量驾驶场景(scenarios)。而这些感知、V&V数据的取得,耗费人力与时间成本相当高,而且深具挑战。

智能驾驶3D数据的标注耗时费力。在智能驾驶的感知、路径预测、以及规划当中,需掌握物件在空间(立体)环境中的精确位置,所以必须标定空间中的长宽高以及中心点。一般3D的标注工具不方便使用,研究指出,3D数据的人工标注更加耗时,所需的时间为2D数据标注的2~16倍。

跨区的数据使用也有其限制。能否将甲地的数据使用在乙地?比如在欧洲收集以及标注的数据使用在美国?研究显示有其局限性。几个原因,各区域的物件种类、分布不同,如美国的皮卡、台湾的摩托车,远高于其他地区;另外,经过几个数据集分析,一般美国车的大小高于欧洲车。当然可以想见天候、地貌、道路规划、号志规则也大不相同。此外各地的驾驶习惯也有想当大的差异:车辆密度、以及路况的反应,例如遇到前侧方打方向灯时,各地区的驾驶反应大不相同。

建构3D动画,模拟生成的数据存在应用领域差异的问题。既然收集标注不易,那就使用3D动画生成路况,直接掌握各个物件、环境参数。但是真实场景的生成程序繁琐,通常产生的路段、场景有限,不具多样性。另一个更具挑战的是Sim2Real的障碍:模拟场景(simulation;sim)所训练出的AI演算法,在真实环境中(Real)同样会因跨域(cross-domain)的问题而大打折扣,因两方的光影、材质、线条风格等差异颇大,3D动画很难成为主流数据。

特殊物件以及场景的稀少性是另一个挑战。比如各地都有造型特殊的交通工具,可能在训练数据中未曾出现,在识别当下常被忽略,比如一台倒在路面只看到白色车厢顶的货车、特殊造型工程车等。更多的是各种少量的驾驶边角场景,一般难以收集,例如临时封街办流水席、深夜一头牛冲上高速公路等。少量边角案例常造成智能驾驶的安全事故,并已有多起案例发生。

数据取得成本高,那可以考虑少量样本技术(few-shot learning)吗?这些技术一般针对数据取得不易的医学或是工业应用,而且预期会在类似的工作中转换。相关技术对于精度以及稳定度标准高的车辆感知与控制,一般不会采用。

看到这麽多数据取得的挑战,难道就限制智能驾驶技术的发展?无法商品化?当然不是。除了耗时、投入大量资金采用全人工标注之外,在工程以及学术上,已经证实有些方法可以大大降低数据标注的成本,后续的文章,我们再继续探讨可能采用的数据策略。

徐宏民(Winston Hsu)现任富智捷(MobileDrive)技术长暨副总经理以及台大信息工程学系教授。哥伦比亚大学电机博士,专精于机器学习、大规模影像视讯查找与识别。为讯连科技研发团队创始成员,慧景科技(thingnario)共同创始人,NVIDIA AI Lab计划主持人;曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会;十余年产学合作及新创经验。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸识别冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。