智能应用 影音
Dtalk
fetnet

芯片速度是唯一竞争优势?

  • 徐宏民

在云平台的重要应用中,GPU逐渐扮演重要角色。法新社

原本每年3月在硅谷召开的GTC–NVIDIA GPU技术大会,今年因疫情关系,转为在线会议。最能揭示NVIDIA未来技术走向以及众人期待的执行长黄仁勋主题演说,也在硅谷居家防疫下,改到5月中以他家的厨房为主舞台展开。从2016年开始参加GTC会议,当大家这几天讨论崭新的Ampere技术让A100 GPU速度提升多少时,反而嗅到在这酷炫技术展示之外的商业企图心。

从几年前强调深度学习技术的突破,今年展现贴近商业情境的技术手法。全自驾的时程未知,除了持续精进自驾开发平台外,也将芯片拆分为目前市场必备的先进驾驶辅助系统(ADAS),商业应用的无人出租车(Robotaxi),以及自动驾驶。另一有趣的应用是利用深度学习来突破计算机动画的瓶颈,光线追踪(Ray Tracing)技术,让精细的高分辨率画面可以实时运算。原理是让耗时的Ray Tracing只在较小画面上计算,接著使用技术成熟的深度画面超解析技术放大画面。这样的混合作法也可以提供急著提升画面质量的内容以及显示芯片业者参考。

迎接5G时代提出智能闸道服务器EGX,让大量的物联网(IoT)设备可以在地域内的节点运算。工厂、智慧城市、大卖场中的大量传感器不间断的送出讯号,所要求的智能服务(安全、监控等)会有实时性的要求,而且资料庞大,必须在地实时处理。走出资料中心,与5G基地台的连结,甚至与电信公司合作加速5G核心通讯,寻找即将翻转通讯方式的5G服务机会。

这几年GPU几乎主宰了资料中心的深度学习运算,可是能否摆脱配角而在资料中心扮演更重要的角色?如果GPU有高速传输可以直接连结储存设备甚至是各个服务器间的GPU,对于资料中心的业务,会有更大的主导性,特别是目前庞大资料(视讯、语音、网页等)成为资料中心主要负载,带来运算、IO瓶颈。Mellanox的收购就展现了这样的企图心。在演说中也使用网络公司常见的PageRank算法(利用网络连结评监网页质量优劣),来展示新的GPU资料平台可以大大降低传统CPU为主的资料中心成本。

布局机器学习甚至资料分析的软硬件平台。2019年的GTC主题演说已经推出RAPIDS来加速机器学习(深度学习为其子领域之一)的常用套件,因为这些领域进展快速,所以开源社群所扮演的角色就十分重要。今年更进而与分散式资料处理、机器学习的主流Spark开源合作,使用GPU加速。可以想象除了深度学习之外,在云平台的几个重要资料应用,GPU也会逐渐扮演重要角色。

GPU加速更多关键资料服务。SQL资料库几乎是所有软件服务都会使用的功能。推荐系统是广告、电子商务、社群经营、内容服务必备的核心。语音、机器人对话又是接下来即将普及的人机接口(特别使用者接触的机器不再只是桌上型计算机)。GPU能否最终成为这些关键核心应用的军火库,但是由GPU扩展出的软硬件开发套件,与开源社群合作。这不正是GPU、CUDA巩固在深度学习领域所走过的路吗?当然这些服务都有既有的软件供应商存在,但是与主流的开源社群合作,如果效益显现,或许也会驱使其它提供机器学习、资料分析的业者思考GPU资料平台的效益。

NVIDIA或许是与台湾电子产业最类似的硅谷公司,未来难以预测,但是市场的需求可能是拓展版图的探针。正如几年前黄执行长所说的,他们察觉GPU对于深度学习的重要,是遇见了学术界中所进行的研究计画,好奇加以了解,才发现这个可能改变技术典范的机会,因而持续开发软硬件平台来支持。建立竞争障碍不只是让芯片跑越快或是价格越低,而是加强在关键服务平台上的必要性。眼光不是专注在竞争者身上而是未来客户的需求。

徐宏民(Winston Hsu)现任台大资工系教授及NVIDIA AI Lab计画主持人。哥伦比亚大学电机博士,专精于机器学习、大规模影像视讯查找与辨识。为讯连科技研发团队创始成员,慧景科技(工业智能新创)共同创办人;曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会;十余年产学合作及新创经验,近年致力将深度学习技术落实到产业,并协助成立研究开发团队。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸辨识冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。