业界出题学界解题打造YOLOR世界第一物件侦测技术

林佩莹／台北
2021/11/01 01:56
分享

白天枪型侦测画面，包含车种侦测、车辆追踪、过线数量统计、停等时间估计等。中研院

人工智能近年来不仅在技术面及应用面出现许多突破，学界、业界及政府机构间的通力合作，更是蔚为佳话。在2018年1月到2021年12月期间，中研院承接科技部的人工智能专题研究计划，在依循科技部的「业界出题，学界解题」原则，及国研院国网中心的算力资源协助下，中研院信息所特聘研究员廖弘源、资创中心人工智能专题中心CEO吴毅成、信息所林仁俊教授及信息所博士后研究员王建尧博士及魏文丽博士共同努力，顺利解决义隆电子提出侦测并计算车流的需求，先是在2020年设计出举世闻名的YOLOv4系列，今(2021)年5月更发展出独步全球的YOLOR(Your Only Learn One Representation：Unified Network for Multiple Tasks)物件侦测技术。

YOLOR在精度不变的情况下，推论速度比上一版Scaled-YOLOv4足足提升194%。截至2021年10月20日止，YOLOR系列名列real-time object detection on coco数据集世界排名1、2、3名，就连曾以AlphoGo声名大噪的Google团队也只能屈居5、7、9名，可望在电动车产业的发展中，扮演举足轻重角色。

中研院信息所特聘研究员廖弘源。中研院

夜晚鱼眼侦测画面，包含车种侦测、车辆追踪、转矢量统计等。中研院

中研院信息所特聘研究员廖弘源表示，「业界出题，学界解题」模式的好处在于，这些题目是业界真正面临的问题且需解决，经由学界的专业判断及建议，可选择出真正有价值的问题，并集中资源去解决。

义隆电子因担心数据传输量太大，云端设备昂贵且效率低，不希望在路口录到的视讯传回云端处理，经由中研院研发的YOLOv4，用软件(演算法)取代硬件，采用成本较低及制程更加成熟的芯片，在设备端点(Edge)解决问题。

也因为数据不需要在云端间传输，就不用担心传输品质不稳或是泄密的问题，加上每一个设备端点的数据可互相传递，数据内容实时变化，只要改用增强式学习，便可在设备端点直接互传信息，进而动态调整各项控制信号，而不需送到云端处理完成再送回来。

中研院信息所博士后研究员王建尧表示，由于人工智能的计算量非常大，影像识别动辄需要识别数百万张影像，若使用中研院自己的设备，训练一次就要耗费两个月，物件侦测训练要两个多礼拜，为完成一个模型训练约需3个月时间，而且要等到验证完成，才能做下一个验证，若想开发更好的模型，则需旷日废时。

因此中研院开始跟国网中心合作，使用超级电脑进行演算法开发及模型训练，过去需要两个礼拜的运算训练时间，现在已缩短到四天即可完成。不仅取得训练资源的优化，同时团队成员的工作效率也大大提升。

在国网中心算力资源的加持下，为廖弘源团队成员节省更多宝贵时间，因此让团队有更充裕时间去设计更多新的想法。如YOLOR系列目前在real-time object detection on coco数据集世界排名第一名的研究，正是因为有国网中心的算力协助，将原本需要一年的开发时间，缩短到两个月。

廖弘源更表示，下一步要开始发展多物件追踪，如广场的群众各自会往什麽地方走，但因为群众彼此会遮蔽，所以要提取各种特徵来判断，会比侦测演算有更多的困难问题要解决，但廖弘源相信，在团队成员及国网中心的算力支持下，绝对有信心完成下一个突破。

关键字

科技部中研院 AI

加入已选取到「关键字追踪」什麽是「关键字追踪」

业界出题学界解题 打造YOLOR世界第一物件侦测技术

业界出题学界解题打造YOLOR世界第一物件侦测技术