NVIDIA GPU再强化 GPU运算新世纪来临
NVIDIA GPU技术大会(GPU Technology Conference)全球海外巡回首站于上周在台北完美落幕,现场吸引超过2,200多名科学技术人员、开发者、研究人员、政府与企业领袖以及媒体等共襄盛举。
GTC为人工智能与深度学习技术的顶级盛会,与会者不仅能深入了解 GPU解决方案与超级电脑的最新发展,更重要的是,来自不同领域的专家、开发者以及研究人员能透过此次机会相互交流、激发更多火花。
2018年3月于美国圣荷西所举办的首场GTC吸引超过8,000多人参与,现场展示各种AI应用的最新突破,从医疗、大数据、高效能运算到虚拟实境,以及更多采用NVIDIA技术的先进解决方案应用成果。
NVIDIA于2018年美国GTC发布DGX-2人工智能超级电脑,为AI技术人员梦想中的产品。强大的DGX-2系统是企业级的云端服务器,其设计核心是为满足高效能运算与人工智能领域的发展,内含16个Tensor核心的Tesla V100 GPU,较2017年推出的DGX-1效能提升10倍,同时拥有高达512GB的HBM存储器,配置12个NVSwitch光纤互连技术,为全球首款为AI系统提供运算效能达2 petaFLOPS的单一服务器。DGX-2由NVIDIA DGX软件堆叠以及基于NVSwitch技术所打造的可扩充架构所组成。
在此次专访中,NVIDIA解决方案架构暨工程副总裁Marc Hamilton 分享他对于GTC与台湾科技产业生态系发展的看法,Hamilton带领他的技术工程团队与客户及合作夥伴共同推出基于NVIDIA人工智能与深度学习、专业视觉化以及高效能运算的解决方案。透过多次与生态系夥伴及开发者的交流,Hamilton对于台湾的AI发展步伐相当了解。
AI正着手解决HPC等级的扩充问题
AI技术透过改变我们的工作模式、增加人机互动合作以及开创人工智能所驱动的创新新时代来提升企业整体竞争力。AI解决方案正迅速跃昇成为最具成效的新科技,企业络绎不绝地积极投入AI解决方案的怀抱,而DGX-2躬逢其盛,提供一个可立即采用的解决方案,同时兼顾未来扩充所需的AI效能。
DGX-2是专为AI和HPC作业负载所设计,透过具高度弹性的移转技术来简化AI扩充的速度,并藉由大量深度学习所组成的运算丛集结合虚拟化技术,在共享基础架构环境中大幅改善用户和作业负载隔离。透过加速部署模型以及易于扩充的开放式架构,开发团队以及数据科学家得以投入更多时间来挖掘洞察,并减少建立基础架构的时间。
以气象预报系统为例。进行天气预报的HPC应用需要处理大规模的运算节点,透过基于流体流量、物理学以及其他参数的运算变化,气象预测因应而生。
气象预测的精准度取决于模型与演算法的准确性,尤其是有多少重点数据被呈现出来。进行气象预测需要安排一系列复杂的前、中、后处理作业,且所有的预测必须实时交付。预测应用程序于服务器节点上运作,并透过分布在运算节点上的监控程序接收报告。
由于HPC系统动则牵涉数以千计的多核心处理器,深度学习技术需要庞大的数据并且彼此交互传递与运算,因此存储器的需求马上水涨船高,许多HPC的应用软件需要将数据直接汇入到GPU的存储器,以获得最大的运算效能,有时存储器不足,耗费在搬运存储器的时间将会降低整体效能,因此当把多个GPU组合来应用时,存储器的大小与GPU彼此间存储器的传输速度将决定一切。
NVSwitch透过NVLink将GPU间的数据吞吐量极大化
存储器是当今深度神经网络(Deep Neural Networks;DNN)中最大的挑战之一。
DNN需要高速的存储器以存取数据、重量参数以及激活,而开发人员正努力面对DRAM设备中有限的存储器带宽,因为AI系统将透过这些存储器带宽存取DNN中大量的重量参数与激活。
NVIDIA在2016年发表基于Pascal架构的Tesla P100 GPU时,发现以前仰赖PCI Express的数据传输通道与技术已经陷入瓶颈,无法负荷多个GPU间的数据吞吐量,于是积极部署GPU间的数据交换与互连新技术,而NVLink技术便应运而生。
透过单一GPU可支持多达6个NVLink连结,可提供各个独立GPU之间更高的带宽,或于低带宽间仍能直接连接到GPU。事实上,NVIDIA的混合式立方网络(Hybrid Mesh Cube)限制了单一NVLink丛集至8个GPU的大小,即便它是一个NUMA设置仍无法让每个GPU皆能看到彼此。利用8个以上的GPU 需要透过InfiniBand连接多个系统,从而失去NVLink与紧密连结的GPU中存储器共享与低延迟的优势。
DGX-2需要将16颗Volta GPU整合至一个服务器架构中,因此NVIDIA推出NVSwitch,其设计旨在利用一个交换器芯片来切换更多不同的 NVLink连接,单一个NVSwitch具备18个全带宽,运算效能是单一Tesla V100 GPU的3倍,而所有的NVSwitch让各GPU能互连。
NVSwitch的目标是为了增加丛集GPU的数量并支持16个GPU配置,而在DGX-2上共设计了12个NVSwitch连接,提供多达216个数据通道的存储器带宽,满足GPU间每秒最大的300GB数据吞吐量,DGX-2较DGX-1系统提升两倍的速度,这个进化让数据科学家与系统开发者得以进行更复杂的AI应用。
有监于TensorFlow以及所有主要的深度学习架构所采用的NVIDIA NCCL(NVIDIA Common Collectives Library),深度学习架构如 TensorFlow不再需要了解服务器中底层的NVLink拓朴结构。
NVIDIA的AI软件堆叠经过全面优化及更新后能支持采用DGX-2及其他DGX系统的开发者,其中包含NVIDIA CUDA、TensorRT、NCCL、cuDNN以及专为机器人所设计的Isaac软件开发套件(SDK)。
Hamilton表示:「TensorRT 4.0为NVIDIA推出的优化推论加速器新版本。目前TensorRT 4.0已整合到TensorFlow 1.7 ,而TensorRT 4.0为当今最受欢迎的深度学习架构之一。」NVIDIA的工程师非常了解自家GPU,透过针对基于GPU平台的优化和高效能runtime,使TensorRT 4.0 软件能加速深度学习推论于各领域应用。
Hamilton表示:「许多TesorFlow的用户将能从最高推论效能中获益,并藉由TensorRT 了解清楚的工作流程。TensorRT能提供FP16与INT8精准的推论内容,以及高达8倍的推论吞吐量(与低延迟目标中的GPU执行相比)。」
在边缘运算领域,TensorRT可以部署在NVIDIA DRIVE自驾车与NVIDIA Jetson嵌入式平台。而每个架构上的深度神经网络都能在数据中心的NVIDIA DGX系统上进行训练,并部署到所有的边缘装置上。透过TensorRT,开发人员能专注于研发新颖的深度学习应用,而不用费心为推论部署进行繁琐的效能调校。
HGX-2云端服务器平台为大型数据中心建立运算参考架构
NVIDIA旗舰级产品DGX-2超级电脑预计于2018年第3季正式量产上市,为了有效整合台湾的服务器ODM大厂、生态系夥伴以及全球主要的服务器国际品牌,NVIDIA于台北举行的GTC发布HGX-2云端服务器平台,NVIDIA自家的DGX-2便是采用HGX-2所设计的旗舰级产品。
服务器相关产业一直是台湾ODM大厂中,始终保持强劲竞争力的产业之一,透过AI领域的发展机会将有助于台湾系统制造商持续前进。NVIDIA工程团队与台湾ODM大厂保持密切的往来合作,协助缩短从设计到生产部署的开发时间。
HGX-2的设计旨在满足HPC与 AI 领域持续成长的应用需求。这些服务器品牌与ODM大厂正在设计基于HGX-2的系统,为超大数据中心打造各种定制化设计的GPU 加速系统。
HGX-2具备两项突破性功能,包含NVIDIA NVSwitch 网状互连架构,能顺畅串连16个内建Tensor Core 的 NVIDIA Tesla V100 GPU。透过HGX-2服务器建构组件,服务器制造商将能打造完整的服务器平台,以满足各种数据中心的需求。
台湾的AI应用与未来
Hamilton这几年与台湾各产业保持密切的互动,针对AI训练计划,预计培育3,000位AI技术开发人员,藉由与台湾科技部的「博士创新之星计划(LEAP)」合作,提供博士后研究的菁英人士相关实习与AI研究专案参与,其中关于智能医疗的专案最令人期待,目前利用AI技术打造疾病预测研究,逐渐开展人工智能技术进入台湾医疗体系。
另外,Hamilton指出AI的影像判读技术用在晶圆检测已有不错的起步,晶圆损坏与错误检测牵涉精密的检测机台以及工程人员长时间的付出,透过AI的自动侦测与判读技术,将可降低检测成本并掌握时效,对台湾的半导体产业有相当大的帮助。此技术目前也逐步扩展至PCB产业的错误侦测与品质检测应用,AI的应用总是带来令人惊喜连连的创新发展。
- 亚源参与COMPUTEX 2018 多元化电源产品获好评
- 侨威聚焦充电领域 EV充电桩与无线充电吸睛COMPUTEX
- 威联通推出TVS-951X多媒体10GBASE-T NAS
- ZOTAC CUP MASTERS 亚洲区决赛冠军出炉
- 走出移动藩篱 高通欲以更多专用芯片打通关
- 联芸科技于COMPUTEX圆满展出固态硬盘控制芯片
- COMPUTEX新创圆桌会议:共筑全球新创生态系
- 宜鼎推工业级DDR4 2666 全面抗硫化加值不加价
- 威联通荣获2018 COMPUTEX Best Choice Award
- 智能制造需求普及 业者抢攻工业4.0供应链商机
- InnoVEX新创团队竞相投入 IoT、AI、健康与生物科技
- 纬颖携手中华电信合作 体现新一代数据中心技术
- 中磊展出全系列NB-IoT及LTE-M产品
- 神达旗下Mio展出车用软硬件解决方案
- 为物联网应用添上眼睛 晶睿通讯展现三大解决方案
- 振桦积极发展新零售布局 展出三合一在线/线下解决方案
- 英特尔于COMPUTEX发表最新处理器 分享未来PC愿景
- AMI储存应用解决方案 深化台湾VDI整合与应用市场
- 满足数据、影像、电源传输 移动设备导入USB Type-C界面应用更全面
- 智能管理需求大增 宜鼎iCAP云端管理平台应用看涨
- 5G加速物联网发展 完善整合测试能掌握商机
- 技嘉携手Intel共同见证40年处理器千倍效能演进
- QNAP人工智能医疗应用 颠覆NAS应用可能
- 融合移动支付、Beacon 传统商圈转型智能化
- 联网启动新创意 AIoT揭开智能生活序幕
- 群晖于COMPUTEX期间展出新产品、软件与系统升级
- 华硕COMPUTEX发表全新NB并展现保健穿戴装置
- 智能音箱透过AI与硬件扩展优化产品使用体验
- 优纳比首次以主题馆形式COMPUTEX InnoVEX亮相
- 芝奇展示极速DDR4 5066MHz存储器
- 3D传感、3D成像跨出消费电子装置 强化医疗、工控、车用领域布局
- 电竞、工控商机各领风骚 存储器厂竞推新品轮番抢睛
- 大、小尺寸面板价格不同调 牵动品牌业者运筹帷幄空间
- 新零售带动商店无人化 飞捷集团强调移动、自助新体验
- 高速率、低延迟性 5G商转将提升多元应用
- SECO布局亚洲嵌入式系统 拓展智能医疗系统的版图
- 巽晨国际COMPUTEX展出60GHz多项应用揭示5G商机
- COMPUTEX 2018 尚茂参展 聚焦AI及软硬件整合
- 技术与应用并进 物联网发展速度加快
- HDMI将于COMPUTEX展出最新规格
- 万旭电业2018 COMPUTEX展出One stop cable solution
- 理义科技-曲面、异型、防爆触控面板与保护玻璃的市场先驱者
- AI扮演创新触媒 推动汽车智能化革命
- 选购车用储存解决方案 稳定性与定制化能力缺一不可
- 车用电子设计开发 环境、材料、法规三者将是关键
- 电动车市场加速 侨威联手起而行绿能让充电桩效能最佳化
- 法令规范+厂商积极投入 电动车市场成长态势明确
- 掌握无人车商机 利基市场将是台厂最佳机会
- 发展自动驾驶 车联网、AI、嵌入式运算缺一不可
- 正美集团智能标签解决方案 为您打开物联网第一扇门
- 全汉COMPUTEX展出5G、IoT、区块链、电竞方案
- COMPUTEX 2018 打造AORUS梦幻电竞空间
- 映泰专业加密货币挖矿主机板隆重登场 挖矿无须转接卡
- 全何科技V-Color 全新产品重装来袭
- 边缘运算落地应用 5大产品聚焦COMPUTEX 2018
- NVIDIA GPU再强化 GPU运算新世纪来临
- TSC Auto ID于COMPUTEX以全新风貌 打造产业应用专区
- 迈伦与云达联合展出ConnectX-5解决方案
- 物联智能公布GDPR个人数据保护合规白皮书
- Socionext携手致伸科技进军COMPUTEX
- 电竞市场正夯 COMPUTEX各家电竞新品拼场
- COMPUTEX 2018强打智能家庭、AIoT应用
- 拥有全球最完整健保制度 台发展区块链锁定医疗应用
- 尚茂智能智能商舖系统解决方案
- StarFab首创伯乐汇 启动在线新创辅导平台
- 全球科技巨头竞逐区块链赛局
- 台睿精工VCM多元应用 掌握手机触觉回馈商机
- 智微科技全新高速外接式存储装置系列解决方案
- 万亿易创新推出多款GD32E103系列MCU
- 敏博发表新一代SSD、高速DRAM模块与云端监控平台
- 映泰为区块链运算及加密货币挖矿打造一站式解决方案
- 瞻诚科技第三代DVB-T2系列产品正式推出
- Wincomm医疗等级无风扇热插拔触控电脑荣获多项大奖
- 品佳推出新唐科技ISD 91200智能电子锁解决方案
- 泓格参与COMPUTEX2018 展示新工业物联网云方案
- KEYDEX标竿创意于COMPUTEX展出语音翻译麦克风
- 东芝推出工业用及工厂自动化光继电器
- Xperi聚焦智能家居等三大市场 持续催生创新技术
- 宜鼎最新研发数据保存技术 SSD不再怕热
- 手机、AI、物联网大整合 三者齐聚打造未来生活
- AIoT生态系统装置突波保护设计
- AIoT应用走向分流 家用设备智能更接地气
- AI翻转物联网架构 PaaS将扮演关键角色
- Dialog SmartBond产品系列增加蓝牙网状网络支持
- 5G刺激物联网应用创意 运营商业模式走向多元
- 突破人才不足困境 软硬整合已成台湾AI发展契机
- 天奕科技COMPUTEX展示「AI级」无线室内定位技术
- 金融、医疗产业导入区块链技术引爆服务创新能量
- 手机快充与周边商机 威锋USB PD 3.0芯片率先获认证
- LitePoint 5G测试解决方案助力缩短上市时程
- ICY DOCK为AI、HPC和IoT领域提供优质产品优势
- 笔记本电脑出货持续成长 平价变形笔记本电脑威胁平板市场
- AMI与KingTiger结盟 展现电脑系统的超高稳定性与效能
- 数据传输须臾间 人类生活大变革
- 电竞者的最佳夥伴七彩虹iGame Z370主机板
- 十铨科技高效储存产品称霸业界 强势席卷COMPUTEX 2018
- COMPUTEX 2018开展 AI、5G、IoT、电竞与VR、区块链为五大亮点
- COMPUTEX搭配InnoVEX、SmarTEX两大特展 提供多面向数码转型解决方案
- COMPUTEX打造AIoT生态系供应链 业者抢搭顺风车
- 云达科技于COMPUTEX展出AI及5G新解决方案
- 业界推动区块链自律组织 盼政府低监管提供友善环境
- 通讯标准混用问题难解? 定制化模拟测试快速解决困扰
- 物联网商机惊人 三雄决战云端
- 科技新浪潮崛起 谁领风骚?
- 公信2018台北国际电脑展 推出最新解决方案
- Mavin Air-X全球最优质、最小、10小时的真无线耳机
- 建立与众不同的优势 亚源深耕特定电源领域有成
- 铠应将于COMPUTEX 2018实现数码看板零售整合
- 全何科技V-Color将于COMPUTEX展出新产品
- 宇瞻科技于COMPUTEX展览期间 大秀工控研发实力
- 十铨电竞魅力强势席卷COMPUTEX 2018
全新T-FORCE RGB炫光飙速新视野 - SECO布局AIOT提供FPGA与CPU的解决方案
- TSLG耐落防松技术Value Solution Provider
- 物联智能Kalay平台与AI接轨 IoT应用升级
- 七彩虹与承启科技于COMPUTEX展示最新板卡技术
- 晶睿通讯与趋势科技携手 网络摄影机网安全面提升
- 威联通于COMPUTEX 2018展示人工智能医疗影像应用
- 点亮智能城市 宜鼎创新物联方案于COMPUTEX首次亮相
- 公信深耕汽车电子 进军高规格工业电脑领域
- 掌握物联网趋势脉动 宇瞻揭幕COMPUTEX展期亮点
- 威锋宣布取得USB-IF协会USB PD 3.0认证
- 亚源集团参展COMPUTEX 2018展现电源研发技术优势
- Beseye于COMPUTEX展出多项AI功能影像分析技术
- 微软COMPUTEX 2018专题演讲-建构智能未来
- COMPUTEX 2018 Intel主题演讲开始报名
- 芝奇COMPUTEX 2018主办超频改装大赏
- COMPUTEX 2018打造亚洲最具规模新创平台
- 台湾新创开发节点组网传输技术 IoT设备更新可望省下近70%传输成本
- InnoVEX 2018 全球最大的国家代表团-荷兰
- 超微新平台接连上阵 祥硕今年营运新高可期
- 21国顶尖新创齐聚COMPUTEX 以色列也看好台湾实力
- 电源技术创新求变 持续追求更高效能
- InnoVEX创新与新创展区六大亮点 抢摊蓝海新商机
- 抢食英特尔地盘 超微力攻商用战场 Ryzen Pro首获戴尔、联想、惠普3大大厂相挺
- Deep Force评选为最佳认知解决方案供应商之一
- 丽台、无敌科技与长庚大学签署合作备忘录
- IOTA将于InnoVEX谈分散式帐本应用
- COMPUTEX将展出多样化嵌入式产品
- COMPUTEX 2018区分六大应用主题 将首度加入5G与区块链
- COMPUTEX 2018将于6月5日登场 聚焦AI、5G、区块链
- COMPUTEX官方奖项 增列物联网项目
- AI商机热度攀升 成COMPUTEX 2018亮点