赛灵思加速器卡专为高效能运算和大数据作业负载而打造 智能应用 影音
EVmember
Event

赛灵思加速器卡专为高效能运算和大数据作业负载而打造

  • 赖品如台北

赛灵思全新加速器卡Alveo U55C。赛灵思
赛灵思全新加速器卡Alveo U55C。赛灵思

赛灵思在Super Computing 2021(SC21)大会宣布推出Alveo U55C数据中心加速器卡,和一款基于标准、由API驱动的丛集解决方案,以用于大规模部署FPGA。Alveo U55C加速器卡可以为高效能运算(HPC)和数据库作业负载提供卓越的单位功耗效能,并透过Xilinx HPC丛集解决方案轻松扩展。

全新的Alveo U55C加速器卡是专为HPC和大数据作业负载而打造,也是赛灵思有史以来最强大的Alveo加速器卡,运算密度和HBM容量是Alveo加速器产品组合中最高的一款产品。运行大规模运算作业负载的客户可受惠于这款结合赛灵思基于RoCE v2的全新丛集解决方案,并在其现有的数据中心基础设施和网络,运行采用FPGA的强大HPC丛集。

赛灵思执行副总裁暨数据中心事业部总经理Salil Raje表示:「将Alveo的运算能力扩展至HPC作业负载变得比以往更加简单、高效且强大。在架构上,像Alveo卡一般的FPGA加速器,能以最低成本为许多运算密集型的作业负载提供最高效能。我们透过导入基于标准的做法,使客户能在现有的基础设施和网络上打造Alveo HPC丛集。藉由此方法,我们将这些优势大规模地应用在所有的数据中心,是Alveo和自行调适运算在数据中心领域能更广泛应用的重大进展。」

为HPC和大数据应用而打造

Alveo U55C卡结合了目前HPC作业负载所需的许多关键特性,能提供更高的数据平行处理能力、卓越的存储器管理、优化的数据迁移处理流程,以及在Alveo产品组合中最出色的单位功耗效能。Alveo U55C卡为单槽全高半长(FHHL)外形,最大功耗仅150瓦。

与前一代的双槽Alveo U280相比,Alveo U55C提供更优异的运算密度,还将HBM2容量翻倍至16GB。Alveo U55C以更小的外形尺寸提供更强的运算力,有助于建构以Alveo加速器为基础的密集丛集。它专为如大数据分析和AI应用等需要扩展效能的高密度串流数据、高I/O数学运算和大型运算难题而打造。

利用RoCE v2和数据中心衔接并结合200 Gbps带宽,这款API驱动的丛集解决方案使Alveo网络在效能和延迟方面得以媲美InfiniBand网络,且无须限制特定供应商。MPI整合功能使HPC开发者可以从赛灵思Vitis统一软件平台扩展Alveo数据处理。无论是服务器平台或是网络基础架构,都能够运用现有的开源标准和架构,横跨数百张Alveo卡进行效能扩展并共享作业负载和存储器。

软件开发者和数据科学家可以运用Vitis平台对应用程序和丛集的高端编程能力,实现Alveo和自行调适运算的优势。赛灵思大力投入Vitis开发平台和工具,让不具备硬件专业知识的软件开发者和数据科学家得以更轻松地使用自行调适运算。

Vitis平台支持PyTorch和TensorFlow等主流AI架构,以及C、C++和Python等高端程序语言,使开发者能利用特定API和函式库打造领域解决方案,或利用赛灵思软件开发套件在数据中心内轻松加速关键HPC作业负载。

HPC客户使用案例

澳大利亚联邦科学与工业组织(CSIRO)拥有全球最大的无线电天文天线阵列。CSIRO利用Alveo U55C卡处理其平方公里阵列(Square Kilometer Array)无线电望远镜中的信号。

将Alveo卡部署为具备HBM的网络连接加速器,能为HPC信号处理丛集提供大规模的传输量。以Alveo加速器为基础的丛集让CSIRO能够处理庞大的运算任务,例如将来自13.1万个天线的实时数据聚合、过滤、准备和处理。

420张Alveo U55C卡由支持P4的100Gbs交换器达到完全连线,可为信号处理丛集提供460GB的HBM2带宽。Alveo U55C丛集的处理效能可达每秒15Tb的总传输量,功耗更低且更具成本效益。CSIRO现正完成Alveo参考设计,以帮助其他无线电天文学或相关产业取得成功。

全球几乎所有的汽车公司都采用Ansys LS-DYNA的碰撞模拟软件。安全性和结构系统设计往往取决于模型效能,因其能透过电脑辅助设计有限元素法(FEM)的模拟技术来降低物理碰撞测试的成本。

FEM求解器是驱动具备数亿自由度模拟的主要演算法,而这些庞大的演算法可以分解为像是PCG、稀疏矩阵、ICCG等更基础的求解器。与x86 CPU相比,LS-DYNA利用超平行数据处理在大量Alveo卡进行效能扩展,可提高5倍以上的效能。

如此一来,就能在Alveo数据处理中提升每个时脉周期的工作效率,让LS-DYNA客户受益于突破性的模拟时程。

Ansys战略合作夥伴总监Wim Slagter表示:「秉持创新不懈的精神,我们很高兴能与赛灵思合作,在我们的LS-DYNA模拟应用中大幅加速有限元素求解器,显现出隐式有限元素法90%的运算负载特性。我们期待透过赛灵思加速的助力,实现产业创新者未来在设计与开发的使命。」

顶尖的图分析平台供应商TigerGraph使用多张Alveo U55C卡,为两种最高效能演算法进行丛集和加速,驱动以图为基础的推荐和丛集引擎。对于数据科学家来说,图数据库是一个颠覆性的平台。图从数据孤岛中蒐集数据,并聚焦于数据间的关系。图领域的下一个突破是能实时找到这些答案。

Alveo U55C将推荐引擎的查询和预测时间从数分钟缩短至数毫秒。与以CPU为基础的丛集相比,使用多张U55C卡来扩展分析,出色的运算力和存储器带宽可将图查询速度提升高达45倍,品质评分也提升高达35%,从而大幅提升可信度,也能将误报率降至个位数。