Azure FX VM协助Ansys RedHawk-SC降低成本 缩短执行时间 智能应用 影音
工研院
DForum0515

Azure FX VM协助Ansys RedHawk-SC降低成本 缩短执行时间

  • 林稼弘台北讯

微软与Ansys密切合作,制定精细的解决方案,使RedHawk-SC在Azure的高效能运算(HPC)基础结构上运行。台湾微软

微软与Ansys密切合作,制定精细的解决方案,使RedHawk-SC在Azure的高效能运算(HPC)基础结构上运行。台湾微软

什麽是Ansys RedHawk-SC?现代半导体集成电路,或称为芯片,可加载超过500亿个晶体管。这样的设计势必得仰赖电子设计自动化 (EDA;Electronic Design Automation) 类别下的软件工具,以支持、自动化和验证芯片设计流程的每一步骤。RedHawk-SC即是由Ansys开发的EDA工具,以领先市场之姿,提供Power Integrity的服务。这对所有半导体的设计流程是很关键的验证步骤,Sign off演算法需耗费极多资源,驱动成千上百个 CPU 核心持续运作好几个小时,使之成为云端运算理想的应用程序。

为云端而生

RedHawk-SC架构于Ansys SeaScape Cloud friendly分析平台上,其SeaScape数据库具完全分散性,非常适合用于在网络上的分散式磁碟存取。RedHawk-SC分散运算工作负载至多个存储器条件低的Worker,每个Worker不到32GB。每个CPU则可运行一个或多个 Worker。在只能使用一些Worker的情况下,这种弹性运算架构能尽快实时启动。

运算工作负载的分散仅会占用必要的存储器,因此最佳使用率可达2,500以上个CPU,也不需要繁重的主节点,因为会由极轻量的排程器协调分散,即使是最大的芯片,也仅耗费不到2GB。加载、查看或故障排除结果等都是同等道理。

RedHawk - SC on Azure工作负载

如RedHawk-SC等EDA应用程序对于最佳云端部署有特定的需求。我们将这些考量整理成以下重点:

(1)签核产生非常大量的工作负载,需要上千万个CPU和数千百GB容量的磁碟。

(2)大型设计尺寸需要云端内有持续或分散式的数据和结果的储存空间。

(3)高带宽网络的Worker沟通呼叫(10Gbps以上)。

Ansys和微软共同推出在Intel驱动的Azure云端执行个体上操作RedHawk-SC,并评估其实际工作负载,以及如何配置最佳的硬件设定。

(表1)针对代表性小型区块(Block)工作负载、中型丛集/分区(Cluster/Partition)工作负载,和大型「全芯片(Full Chip)」工作负载的 RedHawk-SC 资源需求。台湾微软

(表1)针对代表性小型区块(Block)工作负载、中型丛集/分区(Cluster/Partition)工作负载,和大型「全芯片(Full Chip)」工作负载的 RedHawk-SC 资源需求。台湾微软

EDA 的云端运算模型

微软与Ansys密切合作,制定精细的解决方案,使RedHawk-SC在Azure的高效能运算(HPC)基础结构上运行。这些目标参考架构使转移至Azure顺畅无碍,并协助设计团队以更少的成本,更迅速地执行。

IC设计公司可能会选择与像Azure的云端供应商以云原生(All In)的模式合作,即整个设计专案皆在云端执行,或是他们会寻找「混合型」(Hybrid)的合作模式,运用云端资源,来补足他们现有的地端的Capacity(如图1所示)。

(图1)混合型与云原生模式在云端都有主节点和运算节点。台湾微软

(图1)混合型与云原生模式在云端都有主节点和运算节点。台湾微软

Ansys和微软Azure已验证RedHawk-SC可符合「All in / Hybrid」使用模式和授权的条件。

为EDA最佳化的Azure基础结构

为了缩短run time (执行时间),各公司一般会先着手投资支持最高时脉速度的处理器。此外,善用云端有另一层效率考量,例如数据中心的使用效率与工作流程最佳化的架构,测试报告显示云端上可扩充的储存空间对于EDA最佳化的架构有极大的影响。

Azure采用全新Intel处理器,打造FXv1 VM执行个体,其特别为含有高存储器需求的运算密集型工作负载所设计,符合RedHawk-SC需求。FXv1不只时脉速度高达 4.1GHz,也具有低延迟快取的特性,以及高达2TB的NVMe本地磁碟,并拥有RedHawk-SC渴望的High IOPS Throughput。RedHawk-SC在Intel也善加利用了Intel的Math Kernel Library。

透过广泛测试这些实际的工作负载,微软和Ansys提供最佳化软件配置的建议,以在 Azure上操作RedHawk-SC,如下图2所示。Azure Silicon团队选择以下基础结构来支持这项测试:

(1)采用第二代Intel Xeon可扩充处理器的FX VM系列。

(2)Azure 50GbE Accelerated Networking。

(3)CycleCloud Operations Orchestration。

Azure的加速网络提供高带宽50GbE以太网络,串接Worker和Smart NICs。从CPU卸载网络负载,因此提升了运算吞吐量。除此之外,CycleCloud Operations Orchestration用于动态部署虚拟机器以支持RedHawk-SC。

(图2)在Azure混合云端上执行Ansys RedHawk-SC的参考架构。台湾微软

(图2)在Azure混合云端上执行Ansys RedHawk-SC的参考架构。台湾微软

运用大型的全芯片工作负载测试FXv1执行RedHawk-SC(如图1所示)显示随着 CPU 数量上升,执行时系统近乎呈线性发展。期望的扩展程度反映有效率的分散式技术,展现了RedHawk-SC的SeaScape架构以及FXv1提供每个核心的最佳化高存储器容量。

在展示Worker数量的微软Azure FXv1 VM上执行不同RedHawk-SC工作负载所需的执行时间。台湾微软

在展示Worker数量的微软Azure FXv1 VM上执行不同RedHawk-SC工作负载所需的执行时间。台湾微软

经由图1,令人惊讶的发现是,在Azure执行一个RedHawk-SC工作的总成本其实会随着您增加Worker数量(至最大限制数量)而下降,与一般认知总成本会随着您纳入愈多 CPU而增加相抵触。这与RedHawk-SC能达到的最高CPU使用率有关。Worker的最佳数量相等于RedHawk-SC自动计算的Power Partition这个结果直觉上并不明显,客户不应该尝试减少CPU数量来节省成本。事实上,他们其实应该要增加到最佳的CPU。

结论

广泛测试Azure上的RedHawk-SC使微软采用Intel处理器的以利以云端为基础的EDA工作。此配置显示超过240个CPU在一系列实际、非常大规模的EDA工作负载上的优秀扩展能力。此测试进一步得知CPU的最佳数量,协助大幅降低执行Azure上RedHawk-SC的总成本。最终,客户可以在Azure上运用最佳的配置,轻松设定他们针对吞吐量和成本的power integrity signoff analysis。

了解Ansys Cloud in Azure Marketplace

更多信息,点击最新Ansys Cloud on Azure白皮书


关键字