OpenCompute在机器学习技术的应用 智能应用 影音
EVmember
ST Microsite

OpenCompute在机器学习技术的应用

AMD Radeon绘图技术事业群PMTS软件开发工程师钟文衡(Jack Chung)。
AMD Radeon绘图技术事业群PMTS软件开发工程师钟文衡(Jack Chung)。

超微(AMD)Radeon绘图技术事业群PMTS软件开发工程师锺文衡,以「Open Compute在机器学习技术的应用」做演说。他指出机器智能技术可应用在自驾车、智能家庭、无人机、个人机器人、HPC高效能电脑、保全防护、云端控制、金融服务、纳米机器人、工厂制造工程、医学、能源与个人助理等领域。

而AMD于2016年底推出Radeon Instinct方案,根基于Radeon Instinct硬件加速器、Radeon Open Compute for Machine Learning(ROCm)开放运算平台,针对上述各种应用领域提供最佳化机器学习?深度学习的软件框架与应用。

锺文衡指出业者初期可以服务器为主的Radeon Instinct MI6/MI8/MI25硬件加速器开发,其与AMD嵌入式装置的GPU/APU架构相近,所开发的软件?应用可顺利转移。MI6-采Polaris GPU核心、提供5.7TFLOPS、224GB/s存储器带宽与功耗150W,MI8-采Fiji GPU核心、Small Form Factor(SFF)外观、提供8.2TFLOPS、512GB/s存储器带宽与功耗175W,MI25采内建High Bandwidth Cache与控制芯片的Vega GPU核心、提供较上代两倍数学运算效能、设计功耗300W。

Radeon Open Compute for Machine Learning(ROCm)开放运算平台,系统架构上有底层ROCm驱动程序与中层ROCr System Runtime API;软件开发者藉由开源的前端编译器(Compiler Front-End)编译出CPU code与GPU code,程序码打包后置于最上层Language Runtime API与UCX这一层。

而ROCm撰写模式选项上,可使用:1.HIP-将以CUDA函式撰写的程序码转换、移植成可携性C++程序码的工具。2.HCC编译器-标准以AMD GPU平台开发的C++编译器。3.OpenCL-将针对一般CPU、GPI、FPGA所开发的OpenCL函式的C语言转换、移植。

以上HCC、HIP、OpenCL函式以至于Python底层,到MIOPEN、BLAS/FFT/RNG、NCCL、C++STL中间层与函式库都是开源(Open Souce)设计,并可搭配到最上层Caffe/CNTK、TensorFlow/Chainer、Torch 7/Theano、MxNet等应用框架。

锺文衡提到AMD提供以OpenCL函式或HIP编译器所撰写的MI Open最佳化深度学习函式库,内含摺积(Convolutions)、Pooling、Softmax运算,与数据常规化(Normalization)等常用的程序码片段,能搭配AMD GPU/APU平台并发挥最佳化深度学习的加速效果。而AMD Radeon Instinct具备的MxGPU所需的SRIOV硬件虚拟化技术,可搭配数据中心的服务器,虚拟出多个在不同操作系统独立操作、不受干扰的GPU机器学习加速环境。

锺文衡提到Radeon Instinct技术,搭配即将推出的14nm制程、Zen架构的Naples服务器处理器,可建构出低成本、低延迟架构、点对点通讯(Peer to Peer Communication)与高密集运算足迹(High Density Footprint)的数据中心。

AMD从2012年6月与产业界创立HSA异质系统架构基金会,公开跨CPU架构的ROCm开放运算平台,同时也是异质加速器互连架构(CCIX)、次时代汇流排(Gen-Z)与OpenCAPI联盟的创始会员。目前运用Radeon Instinct深度学习技术的实际产品,有Super Micro的SYS 1028GQ-TRT 1U机架式服务器。