
接续在GTC 2018的观察。这个在硅谷圣荷西举办,近年来人工智能(深度学习)技术最火热的产业会议,今年人数爆增到8,500人。
和去年相比,市场的期望是什么?我的观察:前几年大家想了解什么是深度学习技术、可以做什么?今年明显感受到,大家在乎的是如何将技术落地为产品。
深度学习技术有极大的突破,但是落地为产品还是有诸多挑战。比如,如何设计符合需求的網絡?具有关键角色的训练數據在哪里?目前的網絡模型过大(数百万个参数)、耗费存儲器、运算资源,如何提升训练跟推理时的效率?终端环境的硬件设计呢?跟既有的軟件工程系统如何衔接?
比如说,训练數據是大家产品开发上第一个遇到的问题。在这次会场上我们发表了50分钟的技术演说,分析如何有效率的采集关键性的深度(机器)学习训练數據以及训练方式,在现场也满满感受到这股强烈的需求。
我们整理了四种策略:首先由社群媒体上的公开影像、视讯、对话等下载所需的數據,再透过群众外包完成标注。其次是利用弱监督(weakly supervised)或是半监督(semi-supervised)的算法,利用少量的标注數據(或是包含其它未标注的大量數據)进行学习训练,以降低昂贵费时的數據标注。再来是使用不同(接近线性)的转换方式,产生更多(但是近似)的數據。最后,也是目前看来最有机会的,善用3D图像生成,或是生成对抗網絡(GAN)来生成跟多互补性的训练數據。
NVIDIA也呼应这个训练數據、训练环境的主轴,分别推出针对自驾车以及机器人训练的图形模拟平臺。当然对于客户急需部署深度学习推论功能在大型数据中心,也将技术扩及到Kubernetes开源系统;在终端环境加速推理效率的TensorRT。
我料想,接下来在深度学习的技术浪潮中,重心会从炫目的展示,转换到谁的产品技术策略正确、谁的解决方案愿意让客户买单才是!