AMD发布Radeon Instinct加速推机器智能

孙昌华／台北
2016/12/16
分享

AMD发表新策略，在服务器运算中以全新硬件与开源软件方案，加速机器智能新时代，其设计大幅提升效能与效率，并更易于深度学习工作负载的执行。

全新Radeon Instinct加速器将为客户提供强大且基于GPU的解决方案以执行深度学习推论与训练工作。除了新推出的硬件方案，AMD同时发表MIOpen，乃针对GPU加速器设计的免费开源函式库，协助执行高效能机器智能方案。另外还推出以AMD ROCm软件为基础的全新优化深度学习框架，为机器智能工作负载的演进奠定基础。

平价的高容量存储、大量的感应驱动数据以及飞快增长的使用者产生的内容，在全球各地产生以Exabytes计的数据。近期在机器智能演算法与高效能GPU获得诸多进展，使处理与解读数据的程度得到数个量级的提升，几乎能实时产生数据洞察。Radeon Instinct为机器智能打造开放软件产业体系的蓝图，协助加速洞察推论与演算法训练。

AMD总裁暨CEO苏姿丰博士表示，Radeon Instinct设计旨在于MIOpen与ROCm内的高效能GPU加速器与免费开源软件大幅加快机器智能的发展速度。结合高效能运算与绘图功能以及跨时代产品蓝图，AMD为业界唯一拥有GPU与x86矽专业技术的公司，不仅能满足数据中心种类广泛的需求，还能协助推动机器智能的多元发展。

在上周举行的AMD技术高峰会上，来自1026间实验室、Inventec、SuperMicro、加拿大多伦多大学氢强度映射实验(CHIME)无线电望远镜计划，以及Xilinx的客户与夥伴均赞赏Radeon Instinct的推出，探讨如何使用AMD的机器智能与深度学习技术，以及如何从Radeon Instinct中获益。

Radeon Instinct加速器特性包含被动式冷却、符合单根I/O虚拟化技术(SR-IOV)业界标准的AMD多重GPU硬件虚拟化技术，以及针对多重GPU点对点支持的64-bit PCle庞大基址寄存器支持。

Radeon Instinct加速器设计以支持广泛的机器智能应用程序

Radeon Instinct MI6加速器基于广受推崇的Polaris GPU架构，这款被动式冷却推论加速器针对作业？时间？焦耳进行最佳化，FP16效能在150瓦的板卡功耗与16GB的GPU存储器下，能达到5.7 TFLOPS的尖峰值。

Radeon Instinct MI8加速器运用高效能低功耗的「Fiji」Nano GPU，为一款微型异质化高效能运算与推论加速器，FP16效能在仅耗用少于175瓦的板卡功耗与4GB的高带宽存储器(HBM)配备下，就能达到8.2 TFLOPS的尖峰值。

Radeon Instinct MI25加速器将采用AMD下一代高效能Vega GPU架构，除了针对深度学习训练设计，并为追求实时解决方案进行优化。

众多开源解决方案为Radeon Instinct硬件挹注动能

MIOpen GPU加速函式库：协助解决高性能机器智能执行的挑战，免费的开源MIOpen GPU加速函式库预计在2017年第1季释出，针对各种标准常式提供GPU调校的执行方案，包括卷积、池化(pooling)、活化函数、正规化及张量格式等。

ROCm深度学习框架：ROCm平台现已为各种热门深度学习框架优化，包含Caffe、Torch 7及Tensorflow，让程序开发人员能专注于训练类神经网络，透过ROCm多方面的整合设计省去低端效能的调校作业。

ROCm以作为解决下一波机器智能难题的基础为目标，搭配线性代数与张量方面的特定领域编译器、开放式编译器，以及程序语言执行阶段等资源。

AMD也同时投入研发超越当今PCIe Gen3标准的互连技术，进一步推动未来机器智能应用程序的效能。此外，AMD正在与多个开放式高效能I/O标准合作，支持广泛的产业体系服务器CPU架构包括X86、OpenPOWER以及ARM AArch64。

作为CCIX、Gen-Z与OpenCAPI的创始成员，AMD将致力于为Radeon Instinct开发未来的25 Gbit/s phi加速器以及机架型连接模块。Radeon Instinct产品预计在2017上半年推出，想了解更多信息请浏览Radeon.com/Instinct。

关键字

超微机器学习 GPU

加入已选取到「关键字追踪」什麽是「关键字追踪」

商情专辑－开源电子软硬件开发平台专辑