智能应用 影音
工研院
ST Microsite

NVIDIA GTC 2018观察(二):深度学习市场的期待

深度学习技术已有极大突破,但是落地为产品还是有诸多挑战。预料接下来的重心将会转移到谁的产品技术策略正确、客户愿意买单。NVIDIA Corporation

接续在GTC 2018的观察。这个在硅谷圣荷西举办,近年来人工智能(深度学习)技术最火热的产业会议,今年人数爆增到8,500人。

和去年相比,市场的期望是什麽?我的观察:前几年大家想了解什麽是深度学习技术、可以做什麽?今年明显感受到,大家在乎的是如何将技术落地为产品。

深度学习技术有极大的突破,但是落地为产品还是有诸多挑战。比如,如何设计符合需求的网络?具有关键角色的训练数据在哪里?目前的网络模型过大(数百万个参数)、耗费存储器、运算资源,如何提升训练跟推理时的效率?终端环境的硬件设计呢?跟既有的软件工程系统如何衔接?

比如说,训练数据是大家产品开发上第一个遇到的问题。在这次会场上我们发表了50分钟的技术演说,分析如何有效率的采集关键性的深度(机器)学习训练数据以及训练方式,在现场也满满感受到这股强烈的需求。

我们整理了四种策略:首先由社群媒体上的公开影像、视讯、对话等下载所需的数据,再透过群众外包完成标注。其次是利用弱监督(weakly supervised)或是半监督(semi-supervised)的算法,利用少量的标注数据(或是包含其它未标注的大量数据)进行学习训练,以降低昂贵费时的数据标注。再来是使用不同(接近线性)的转换方式,产生更多(但是近似)的数据。最后,也是目前看来最有机会的,善用3D图像生成,或是生成对抗网络(GAN)来生成跟多互补性的训练数据。

NVIDIA也呼应这个训练数据、训练环境的主轴,分别推出针对自驾车以及机器人训练的图形模拟平台。当然对于客户急需部署深度学习推论功能在大型数据中心,也将技术扩及到Kubernetes开源系统;在终端环境加速推理效率的TensorRT。

我料想,接下来在深度学习的技术浪潮中,重心会从炫目的展示,转换到谁的产品技术策略正确、谁的解决方案愿意让客户买单才是!

徐宏民(Winston Hsu)现任富智捷(MobileDrive)技术长暨副总经理以及台大信息工程学系教授。哥伦比亚大学电机博士,专精于机器学习、大规模影像视讯查找与识别。为讯连科技研发团队创始成员,慧景科技(thingnario)共同创始人,NVIDIA AI Lab计划主持人;曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会;十余年产学合作及新创经验。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸识别冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。