广泛且开放的HPC+AI产品组合 为效能和科学用生成式AI注入动力 智能应用 影音
工研院
ADI

广泛且开放的HPC+AI产品组合 为效能和科学用生成式AI注入动力

  • 陈其璐台北

在德国汉堡所举行的2023年国际超级电脑大会,英特尔和美国阿贡国家实验室说明Aurora超级电脑的安装进度。阿贡国家实验室
在德国汉堡所举行的2023年国际超级电脑大会,英特尔和美国阿贡国家实验室说明Aurora超级电脑的安装进度。阿贡国家实验室

英特尔在2023年国际超级电脑大会(ISC High Performance)上,展示高效能运算(HPC)和人工智能(AI)工作负载的领先效能,并分享以oneAPI开放式程序设计模型为中心的未来HPC和AI产品;同时也宣布一项国际计划,利用Aurora超级电脑为科学和社会开发生成式AI模型。

英特尔公司副总裁暨超级运算事业部总经理Jeff McVeigh表示:「英特尔致力为HPC和AI社群提供产品服务,协助客户和终端使用者能够更快达成突破性的发展。我们的产品组合横跨Intel Xeon CPU Max系列、Intel Data Center GPU Max系列、第4代Intel Xeon可扩充处理器和 Habana Gaudi2,于多项工作负载表现均优于竞争对手,提供能源和总拥有成本优势,让AI民主化的同时,还提供选择性、开放性和灵活性。」

为各项工作负载提供具有竞争力的处理器

动态、新兴的HPC和AI工作负载需要一个完整的硬件与软件解决方案产品组合。McVeigh综述英特尔的各项数据中心产品,这些产品为HPC社群提供许多选择和解决方案,协助实现AI民主化。

McVeigh在演说中介绍英特尔的次时代处理器,将能够满足高存储器带宽需求。英特尔所引领的生态系为Granite Rapids开发一款新型DIMM-Multiplexer Combined Ranks(MCR)。MCR在DDR5的基础上达成8,800MT/s速度,在双插槽系统中实现大于1.5TB/s的存储器带宽能力。提升此类的存储器带宽,对于满足现代CPU快速成长的核心数量,以及实现效率和灵活性而言十分重要。

英特尔还公开Supermicro推出的新款、针对AI最佳化的x8 Max系列GPU子系统,专为加速深度学习训练而设计。除了2023年稍晚可透过Intel Developer Cloud beta使用该系统之外,多家OEM将提供包含Max系列GPU x4和x8 OAM子系统和PCIe卡的解决方案,这些解决方案预计于今夏上市。

oneAPI实现高生产力、开放的加速运算

全球约有90%的开发者,使用或是受益于为英特尔开发或最佳化的软件。自2020年推出oneAPI程序设计模型以来,开发者已在来自多个硬件供应商,不同的CPU、GPU、FPGA和AI芯片上展示oneAPI,解决单一供应商把持加速程序设计模型的挑战。最新的Intel oneAPI透过OpenMP GPU卸载进而加速HPC应用,延伸支持OpenMP和Fortran,并透过最佳化框架来加速AI深度学习,包含TensorFlow、PyTorch以及相关AI工具,让效能获得数个量级的提升。

为了让程序设计师更容易开发oneAPI多架构程序,oneAPI实作SYCL,并由Codeplay开发针对NVIDIA和AMD处理器的外挂程序,以及Intel DPC++兼容性工具(使用开放原始码SYCLomatic);这款工具可以将CUDA转换至SYCL和C++,一般而言可自动转换90%〜95%程序码。透过这种方式产生的SYCL程序码,可比拟在NVIDIA和AMD原生系统语言上执行相同程序码的效能。数据显示,于Max系列GPU执行DPEcho天文物理学应用SYCL程序码,其效能相较在NVIDIA H100执行同样的CUDA程序码更高出48%。

拥抱SYCL的生态系正在蓬勃发展。Atos旗下的Eviden宣布与英特尔合作推出CEPP one+,这是一款使用Eviden卓越效能程序设计中心(CEPP)的HPC∕AI程序码现代化服务。CEPP one+将专注接纳SYCL和OpenMP,为社群做好异质运算环境的准备,同时透过开放标准提供硬件选择的自由。