NVIDIA GTC 2018观察（二）：深度学习市场的期待

徐宏民
2018-04-25
分享
Line

深度学习技术已有极大突破，但是落地为产品还是有诸多挑战。预料接下来的重心将会转移到谁的产品技术策略正确、客户愿意买单。NVIDIA Corporation

接续在GTC 2018的观察。这个在硅谷圣荷西举办，近年来人工智能（深度学习）技术最火热的产业会议，今年人数爆增到8,500人。

和去年相比，市场的期望是什麽？我的观察：前几年大家想了解什麽是深度学习技术、可以做什麽？今年明显感受到，大家在乎的是如何将技术落地为产品。

深度学习技术有极大的突破，但是落地为产品还是有诸多挑战。比如，如何设计符合需求的网络？具有关键角色的训练数据在哪里？目前的网络模型过大（数百万个参数）、耗费存储器、运算资源，如何提升训练跟推理时的效率？终端环境的硬件设计呢？跟既有的软件工程系统如何衔接？

比如说，训练数据是大家产品开发上第一个遇到的问题。在这次会场上我们发表了50分钟的技术演说，分析如何有效率的采集关键性的深度（机器）学习训练数据以及训练方式，在现场也满满感受到这股强烈的需求。

我们整理了四种策略：首先由社群媒体上的公开影像、视讯、对话等下载所需的数据，再透过群众外包完成标注。其次是利用弱监督(weakly supervised)或是半监督(semi-supervised)的算法，利用少量的标注数据（或是包含其它未标注的大量数据）进行学习训练，以降低昂贵费时的数据标注。再来是使用不同（接近线性）的转换方式，产生更多（但是近似）的数据。最后，也是目前看来最有机会的，善用3D图像生成，或是生成对抗网络（GAN）来生成跟多互补性的训练数据。

NVIDIA也呼应这个训练数据、训练环境的主轴，分别推出针对自驾车以及机器人训练的图形模拟平台。当然对于客户急需部署深度学习推论功能在大型数据中心，也将技术扩及到Kubernetes开源系统；在终端环境加速推理效率的TensorRT。

我料想，接下来在深度学习的技术浪潮中，重心会从炫目的展示，转换到谁的产品技术策略正确、谁的解决方案愿意让客户买单才是！

徐宏民
台大资工系教授

徐宏民(Winston Hsu)现任富智捷(MobileDrive)技术长暨副总经理以及台大信息工程学系教授。哥伦比亚大学电机博士，专精于机器学习、大规模影像视讯查找与识别。为讯连科技研发团队创始成员，慧景科技(thingnario)共同创始人，NVIDIA AI Lab计划主持人；曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会；十余年产学合作及新创经验。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸识别冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。