智能应用 影音
Microchip
20210512_DForum台北工厂

NVIDIA推出Mellanox 400G InfiniBand

  • 赖品如/台北

NVIDIA Mellanox NDR 400G InfiniBand 产品系列。

NVIDIA(辉达)于SC20大会上,宣布推出NVIDIA Mellanox 400G InfiniBand,这是400Gb/s网速的端到端网络解决方案,可为全球的人工智能(AI)和高效能运算用户提供最快的网络互连效能,同时成功将运算、可程序化和软件定义三种技术结合,成为软件定义、硬件加速的可程序设计网络,为全球的研究人员和工程人员设计新一代运算系统,并针对应用效能的提升提供了新的思维。

NVIDIA Mellanox InfiniBand NDR产品是第7代的InfiniBand产品,利用100Gb/s的PAM4 Serdes技术,实现了较前一代产品两倍提升的400Gb/s单埠传输带宽,同时透过增加更多、更快的加速引擎,实现了更强大的运算和通讯能力。

「Speed of Light」是关于NDR InfiniBand技术的第一个特征,透过加倍的带宽、更快的信息率,让基于RDMA、GPU Direct RDMA和GPU Direct Storage等先进通讯技术的应用效能得到了进一步的提升。InfiniBand网络是自然的SDN网络,可以让使用者根据应用的属性来选择各种不同的网络拓扑,以达到最优化的效能,如Fat-Tree、DragonFly+、各种Torus等。

例如,透过DragonFly+网络拓扑可以同时在四个交换器Hop内达到一百万个节点间的同时通讯,这个规模远远超出了 E级超算 、甚至10 E 级超算或百E级超算需要的规模;同时其自然的SDN属性也让动态路由和网络壅塞控制变得更容易。

InfiniBand动态路由已被广泛地应用到各种网络拓扑中,成为优化通讯效能的关键角色,如美国橡树岭国家实验室的Summit超级计算机就透过动态路由将超级计算机中心全网的通讯效率从60%提升到了96%。NDR InfiniBand交换器在1U空间内可以支持64个400Gb/s的埠或128个200Gb/s的埠,提供较上一代交换器3倍的埠密度;它还将交换器系统的聚合双向吞吐量提高5倍,达到每秒1.64 petabits,是埠数最多、交换容量最大的交换器。

InfiniBand安全卸载是针对Cloud Native的应用场景,InfiniBand已取得Open Stack的官方软件支持,透过自带的硬件IPSec、TLS、AES、Root of Trust等功能,让数据不论是在网络中移动时,还是在向储存中落盘时都能以线速效能取得并解密,实现在虚拟化环境或容器化环境中的安全保障。

软件可程序设计让InfiniBand的应用场景得到了进一步的延伸,可程序化的NDR InfiniBand不仅可以让使用者处理数据的标头,还可以针对数据的路径进行操作,例如使用者可以自订规则并对数据路径进行操作,或是让数据无需送到CPU便可直接在网络中进行预处理。使用者还可以针对数据的通讯特征进行提取,接著利用AI技术进行训练,得到不同应用数据的通用通讯特征,若发现有异常通讯信息,则可以向管理员主动发出预警。

NVIDIA网络事业部门资深副总裁Gilad Shainer表示,对人工智能客户而言,最重要的工作是应对越来越复杂的应用,它们都需要更快、更聪明且更具扩充性的网络。NVIDIA Mellanox 400G InfiniBand的巨大吞吐量与智能加速引擎,让高效能运算、人工智能与超大规模云端基础架构可以透过更低的成本与复杂性,达成无与伦比的效能。

Exascale等级的AI和高效能运算时代已经来临,同时也带来新的挑战。由软件定义、硬件加速、针对网络运算的可程序设计NDR InfiniBand产品将于2021年第2季推出样本。NDR产品的出现,将会大幅提升Exascale等级的AI和高效能运算系统的效能和效率,并简化系统的管理和操作、降低系统的总拥有成本,进而保护数据中心的投资。