AMD发布Radeon Instinct加速推机器智能 智能应用 影音
hotspot
Event

AMD发布Radeon Instinct加速推机器智能

  • 孙昌华台北

AMD发表新策略,在服务器运算中以全新硬件与开源软件方案,加速机器智能新时代,其设计大幅提升效能与效率,并更易于深度学习工作负载的执行。

全新Radeon Instinct加速器将为客户提供强大且基于GPU的解决方案以执行深度学习推论与训练工作。除了新推出的硬件方案,AMD同时发表MIOpen,乃针对GPU加速器设计的免费开源函式库,协助执行高效能机器智能方案。另外还推出以AMD ROCm软件为基础的全新优化深度学习框架,为机器智能工作负载的演进奠定基础。

平价的高容量储存、大量的感应驱动数据以及飞快增长的使用者产生的内容,在全球各地产生以Exabytes计的数据。近期在机器智能演算法与高效能GPU获得诸多进展,使处理与解读数据的程度得到数个量级的提升,几乎能实时产生数据洞察。Radeon Instinct为机器智能打造开放软件产业体系的蓝图,协助加速洞察推论与演算法训练。

AMD总裁暨CEO苏姿丰博士表示,Radeon Instinct设计旨在于MIOpen与ROCm内的高效能GPU加速器与免费开源软件大幅加快机器智能的发展速度。结合高效能运算与绘图功能以及跨时代产品蓝图,AMD为业界唯一拥有GPU与x86矽专业技术的公司,不仅能满足数据中心种类广泛的需求,还能协助推动机器智能的多元发展。

在上周举行的AMD技术高峰会上,来自1026间实验室、Inventec、SuperMicro、加拿大多伦多大学氢强度映射实验(CHIME)无线电望远镜计划,以及Xilinx的客户与夥伴均赞赏Radeon Instinct的推出,探讨如何使用AMD的机器智能与深度学习技术,以及如何从Radeon Instinct中获益。

Radeon Instinct加速器特性包含被动式冷却、符合单根I/O虚拟化技术(SR-IOV)业界标准的AMD多重GPU硬件虚拟化技术,以及针对多重GPU点对点支持的64-bit PCle庞大基址寄存器支持。

Radeon Instinct加速器设计以支持广泛的机器智能应用程序

Radeon Instinct MI6加速器基于广受推崇的Polaris GPU架构,这款被动式冷却推论加速器针对作业?时间?焦耳进行最佳化,FP16效能在150瓦的板卡功耗与16GB的GPU存储器下,能达到5.7 TFLOPS的尖峰值。

Radeon Instinct MI8加速器运用高效能低功耗的「Fiji」Nano GPU,为一款微型异质化高效能运算与推论加速器,FP16效能在仅耗用少于175瓦的板卡功耗与4GB的高带宽存储器(HBM)配备下,就能达到8.2 TFLOPS的尖峰值。

Radeon Instinct MI25加速器将采用AMD下一代高效能Vega GPU架构,除了针对深度学习训练设计,并为追求实时解决方案进行优化。

众多开源解决方案为Radeon Instinct硬件挹注动能

MIOpen GPU加速函式库:协助解决高性能机器智能执行的挑战,免费的开源MIOpen GPU加速函式库预计在2017年第1季释出,针对各种标准常式提供GPU调校的执行方案,包括卷积、池化(pooling)、活化函数、正规化及张量格式等。

ROCm深度学习框架:ROCm平台现已为各种热门深度学习框架优化,包含Caffe、Torch 7及Tensorflow,让程序开发人员能专注于训练类神经网络,透过ROCm多方面的整合设计省去低端效能的调校作业。

ROCm以作为解决下一波机器智能难题的基础为目标,搭配线性代数与张量方面的特定领域编译器、开放式编译器,以及程序语言执行阶段等资源。

AMD也同时投入研发超越当今PCIe Gen3标准的互连技术,进一步推动未来机器智能应用程序的效能。此外,AMD正在与多个开放式高效能I/O标准合作,支持广泛的产业体系服务器CPU架构包括X86、OpenPOWER以及ARM AArch64。

作为CCIX、Gen-Z与OpenCAPI的创始成员,AMD将致力于为Radeon Instinct开发未来的25 Gbit/s phi加速器以及机架型连接模块。Radeon Instinct产品预计在2017上半年推出,想了解更多信息请浏览Radeon.com/Instinct。


关键字