芯片速度是唯一竞争优势？

徐宏民
2020-05-19
分享
Line

在云平台的重要应用中，GPU逐渐扮演重要角色。法新社

原本每年3月在硅谷召开的GTC–NVIDIA GPU技术大会，今年因疫情关系，转为在线会议。最能揭示NVIDIA未来技术走向以及众人期待的CEO黄仁勳主题演说，也在硅谷居家防疫下，改到5月中以他家的厨房为主舞台展开。从2016年开始参加GTC会议，当大家这几天讨论崭新的Ampere技术让A100 GPU速度提升多少时，反而嗅到在这酷炫技术展示之外的商业企图心。

从几年前强调深度学习技术的突破，今年展现贴近商业情境的技术手法。全自驾的时程未知，除了持续精进自驾开发平台外，也将芯片拆分为目前市场必备的先进驾驶辅助系统(ADAS)，商业应用的无人出租车(Robotaxi)，以及自动驾驶。另一有趣的应用是利用深度学习来突破电脑动画的瓶颈，光线追踪(Ray Tracing)技术，让精细的高分辨率画面可以实时运算。原理是让耗时的Ray Tracing只在较小画面上计算，接着使用技术成熟的深度画面超解析技术放大画面。这样的混合作法也可以提供急着提升画面品质的内容以及显示芯片业者参考。

迎接5G时代提出智能闸道服务器EGX，让大量的物联网(IoT)设备可以在地域内的节点运算。工厂、智能城市、大卖场中的大量传感器不间断的送出信号，所要求的智能服务(安全、监控等)会有实时性的要求，而且数据庞大，必须在地实时处理。走出数据中心，与5G基站的连结，甚至与电信公司合作加速5G核心通讯，寻找即将翻转通讯方式的5G服务机会。

这几年GPU几乎主宰了数据中心的深度学习运算，可是能否摆脱配角而在数据中心扮演更重要的角色？如果GPU有高速传输可以直接连结储存设备甚至是各个服务器间的GPU，对于数据中心的业务，会有更大的主导性，特别是目前庞大数据(视讯、语音、网页等)成为数据中心主要负载，带来运算、IO瓶颈。Mellanox的收购就展现了这样的企图心。在演说中也使用网络公司常见的PageRank演算法(利用网络连结评监网页品质优劣)，来展示新的GPU数据平台可以大大降低传统CPU为主的数据中心成本。

布局机器学习甚至数据分析的软硬件平台。2019年的GTC主题演说已经推出RAPIDS来加速机器学习(深度学习为其子领域之一)的常用套件，因为这些领域进展快速，所以开源社群所扮演的角色就十分重要。今年更进而与分散式数据处理、机器学习的主流Spark开源合作，使用GPU加速。可以想像除了深度学习之外，在云平台的几个重要数据应用，GPU也会逐渐扮演重要角色。

GPU加速更多关键数据服务。SQL数据库几乎是所有软件服务都会使用的功能。推荐系统是广告、电子商务、社群经营、内容服务必备的核心。语音、机器人对话又是接下来即将普及的人机界面(特别使用者接触的机器不再只是桌上型电脑)。GPU能否最终成为这些关键核心应用的军火库，但是由GPU扩展出的软硬件开发套件，与开源社群合作。这不正是GPU、CUDA巩固在深度学习领域所走过的路吗？当然这些服务都有既有的软件供应商存在，但是与主流的开源社群合作，如果效益显现，或许也会驱使其他提供机器学习、数据分析的业者思考GPU数据平台的效益。

NVIDIA或许是与台湾电子产业最类似的硅谷公司，未来难以预测，但是市场的需求可能是拓展版图的探针。正如几年前黄CEO所说的，他们察觉GPU对于深度学习的重要，是遇见了学术界中所进行的研究计划，好奇加以了解，才发现这个可能改变技术典范的机会，因而持续开发软硬件平台来支持。建立竞争障碍不只是让芯片跑越快或是价格越低，而是加强在关键服务平台上的必要性。眼光不是专注在竞争者身上而是未来客户的需求。

徐宏民
台大资工系教授

徐宏民(Winston Hsu)现任富智捷(MobileDrive)技术长暨副总经理以及台大信息工程学系教授。哥伦比亚大学电机博士，专精于机器学习、大规模影像视讯查找与识别。为讯连科技研发团队创始成员，慧景科技(thingnario)共同创始人，NVIDIA AI Lab计划主持人；曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会；十余年产学合作及新创经验。曾获2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018伪装人脸识别冠军、杰出信息人才奖、吴大猷先生纪念奖等国内外研究奖项。