Reserch
订报优惠

NVIDIA GTC 2018观察(二):深度学习市场的期待

  • 徐宏民
深度学习技术已有极大突破,但是落地为产品还是有诸多挑战。预料接下来的重心将会转移到谁的产品技术策略正确、客户愿意买单。NVIDIA Corporation

接续在GTC 2018的观察。这个在硅谷圣荷西举办,近年来人工智能(深度学习)技术最火热的产业会议,今年人数爆增到8,500人。

和去年相比,市场的期望是什么?我的观察:前几年大家想了解什么是深度学习技术、可以做什么?今年明显感受到,大家在乎的是如何将技术落地为产品。

深度学习技术有极大的突破,但是落地为产品还是有诸多挑战。比如,如何设计符合需求的网络?具有关键角色的训练资料在哪里里?目前的网络模型过大(数百万个参数)、耗费存储器、运算资源,如何提升训练跟推理时的效率?终端环境的硬件设计呢?跟既有的软件工程系统如何衔接?

比如说,训练资料是大家产品开发上第一个遇到的问题。在这次会场上我们发表了50分钟的技术演说,分析如何有效率的采集关键性的深度(机器)学习训练资料以及训练方式,在现场也满满感受到这股强烈的需求。

我们整理了四种策略:首先由社群媒体上的公开影像、视讯、对话等下载所需的资料,再透过群众外包完成标注。其次是利用弱监督(weakly supervised)或是半监督(semi-supervised)的算法,利用少量的标注资料(或是包含其它未标注的大量资料)进行学习训练,以降低昂贵费时的资料标注。再来是使用不同(接近线性)的转换方式,产生更多(但是近似)的资料。最后,也是目前看来最有机会的,善用3D图象生成,或是生成对抗网络(GAN)来生成跟多互补性的训练资料。

NVIDIA也呼应这个训练资料、训练环境的主轴,分别推出针对自驾车以及机器人训练的图形模拟平台。当然对于客户急需部署深度学习推论功能在大型数据中心,也将技术扩及到Kubernetes开源系统;在终端环境加速推理效率的TensorRT。

我料想,接下来在深度学习的技术浪潮中,重心会从炫目的展示,转换到谁的产品技术策略正确、谁的解决方案愿意让客户买单才是!

徐宏民(Winston Hsu)现任台大资工系教授及NVIDIA AI Lab计画主持人。哥伦比亚大学电机博士,专精于机器学习、大规模影像视讯查找与辨识、前瞻技术商业模式等领域。为讯连科技研发团队创始成员,曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会;十余年产学合作以及新创经验,近年与国内外企业合作,将深度学习技术落实到产品上,并且协助成立深度学习(人工智能)团队。曾获ACM MM 2014 Grand Challenge Multimodal Award、杰出信息人才奖、吴大猷先生纪念奖等多项国内外大奖。