泛人工智能的技术领域

徐宏民
2018-03-20
分享
Line

目前深度学习演算法帮助最大的地方在于复杂、非结构性的数据，应用于医院、交通工具、工业应用、机器人等领域。(图片来源：Pixabay)

早期（1950年左右）的人工智能研究因为技术及环境碰到瓶颈，一直未能落地。直到这几年「深度学习技术」突破之后，「人工智能」又再火红回来。目前大众媒体将电脑做智能分析（或决策）的相关服务都统称为「人工智能」（AI），这是一个偏行销的用词。而其中的关键技术，一般称为「机器学习」(Machine Learning)，有数种不同的子领域，在1980年代开始已陆续实现在一些预测、推荐、分类的应用。因为数据（e-mail、网页、产品、文件、数据库、等）逐渐增多之后，自然需要更聪明的功能。根据需求以及可得的数据，电脑科学家尝试去「逼近」某些「智能方程序」。

早期在应用场域使用的机器学习算法，大都是应用在结构性的数据上，像是关键字、病例数据、购买纪录等。所以过去二十几年大家享受到的文字查找、购物推荐、（或是不喜欢的）在线广告等，大概属于这个范畴。其中的关键是如何定义出最好的「特徵值」，接着使用适合的分类器来实现这个智能方程序。其实过去二十年来，最多人使用的是称为SVM（支持矢量机），其中全世界最多工程、研究人员使用的套件，是台大林智仁教授所开发出来LIBSVM开源软件，这是来自于台湾巨大的贡献。

目前令人瞩目的深度学习演算法帮助最大的领域在于复杂、非结构性的数据；因为网络当中有着以百（千）万为单位的庞大变量，透过层级网络的型态，可以「逼近」复杂的数据型态跟智能方程序。这就是为什麽在影像、视讯、语音的研究上看到这种跳跃式的进步。因为最佳的特徵值、分类器等都可以在深度学习网络训练中一气呵成，自动取得最佳的设定。技术落地为崭新产品的机会，不仅在从使用者端崛起，更在医院、交通工具、工业应用、机器人中逐渐成为重要的感知回馈。

顺应这场智能技术的典范转移，如何在产品、新问题上设计适合的网络，需要大量的训练数据与数量庞大的运算设备（也是NVIDIA会如此火红的原因），如何将这些耗电、运算量大的智能引擎顺利摆上各种硬件或是企业产品，都是亟待解决的问题，以及机会所在！

徐宏民
台大资工系教授

徐宏民(Winston Hsu)现任富智捷(MobileDrive)技术长暨副总经理以及台大信息工程学系教授。哥伦比亚大学电机博士，专精于机器学习、大规模影像视讯查找与识别。为讯连科技研发团队创始成员，慧景科技(thingnario)共同创始人，NVIDIA AI Lab计划主持人；曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会；十余年产学合作及新创经验。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸识别冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。