DForum1108

泛人工智能的技术领域

  • 徐宏民
目前深度学习算法帮助最大的地方在于复杂、非结构性的资料,应用于医院、交通工具、工业应用、机器人等领域。(图片来源:Pixabay)

早期(1950年左右)的人工智能研究因为技术及环境碰到瓶颈,一直未能落地。直到这几年「深度学习技术」突破之后,「人工智能」又再火红回来。目前大众媒体将计算机做智能分析(或决策)的相关服务都统称为「人工智能」(AI),这是一个偏营销的用词。而其中的关键技术,一般称为「机器学习」(Machine Learning),有数种不同的子领域,在1980年代开始已陆续实现在一些预测、推荐、分类的应用。因为资料(e-mail、网页、产品、文件、资料库、等)逐渐增多之后,自然需要更聪明的功能。根据需求以及可得的资料,计算机科学家尝试去「逼近」某些「智能方程序」。

早期在应用场域使用的机器学习算法,大都是应用在结构性的资料上,象是关键字、病例资料、购买纪录等。所以过去二十几年大家享受到的文字查找、购物推荐、(或是不喜欢的)在线广告等,大概属于这个范畴。其中的关键是如何定义出最好的「特征值」,接著使用适合的分类器来实现这个智能方程序。其实过去二十年来,最多人使用的是称为SVM(支持矢量机),其中全世界最多工程、研究人员使用的套件,是台大林智仁教授所开发出来LIBSVM开源软件,这是来自于台湾巨大的贡献。

目前令人瞩目的深度学习算法帮助最大的领域在于复杂、非结构性的资料;因为网络当中有著以百(千)万为单位的庞大变量,透过层级网络的型态,可以「逼近」复杂的资料型态跟智能方程序。这就是为什么在影像、视讯、语音的研究上看到这种跳跃式的进步。因为最佳的特征值、分类器等都可以在深度学习网络训练中一气呵成,自动取得最佳的设定。技术落地为崭新产品的机会,不仅在从使用者端崛起,更在医院、交通工具、工业应用、机器人中逐渐成为重要的感知回馈。

顺应这场智能技术的典范转移,如何在产品、新问题上设计适合的网络,需要大量的训练资料与数量庞大的运算设备(也是NVIDIA会如此火红的原因),如何将这些耗电、运算量大的智能引擎顺利摆上各种硬件或是企业产品,都是亟待解决的问题,以及机会所在!

徐宏民(Winston Hsu)现任台大资工系教授及NVIDIA AI Lab计画主持人。哥伦比亚大学电机博士,专精于机器学习、大规模影像视讯查找与辨识、前瞻技术商业模式等领域。为讯连科技研发团队创始成员,曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会;十余年产学合作以及新创经验,近年与国内外企业合作,将深度学习技术落实到产品上,并且协助成立深度学习(人工智能)团队。曾获ACM MM 2014 Grand Challenge Multimodal Award、杰出信息人才奖、吴大猷先生纪念奖等多项国内外大奖。