OpenCompute在机器学习技术的应用

魏淑芳
2017-03-13
分享

AMD Radeon绘图技术事业群PMTS软件开发工程师钟文衡(Jack Chung)。

超微(AMD)Radeon绘图技术事业群PMTS软件开发工程师锺文衡，以「Open Compute在机器学习技术的应用」做演说。他指出机器智能技术可应用在自驾车、智能家庭、无人机、个人机器人、HPC高效能电脑、保全防护、云端控制、金融服务、纳米机器人、工厂制造工程、医学、能源与个人助理等领域。

而AMD于2016年底推出Radeon Instinct方案，根基于Radeon Instinct硬件加速器、Radeon Open Compute for Machine Learning(ROCm)开放运算平台，针对上述各种应用领域提供最佳化机器学习？深度学习的软件框架与应用。

锺文衡指出业者初期可以服务器为主的Radeon Instinct MI6/MI8/MI25硬件加速器开发，其与AMD嵌入式装置的GPU/APU架构相近，所开发的软件？应用可顺利转移。MI6－采Polaris GPU核心、提供5.7TFLOPS、224GB/s存储器带宽与功耗150W，MI8－采Fiji GPU核心、Small Form Factor(SFF)外观、提供8.2TFLOPS、512GB/s存储器带宽与功耗175W，MI25采内建High Bandwidth Cache与控制芯片的Vega GPU核心、提供较上代两倍数学运算效能、设计功耗300W。

Radeon Open Compute for Machine Learning(ROCm)开放运算平台，系统架构上有底层ROCm驱动程序与中层ROCr System Runtime API；软件开发者藉由开源的前端编译器(Compiler Front-End)编译出CPU code与GPU code，程序码打包后置于最上层Language Runtime API与UCX这一层。

而ROCm撰写模式选项上，可使用：1.HIP－将以CUDA函式撰写的程序码转换、移植成可携性C++程序码的工具。2.HCC编译器－标准以AMD GPU平台开发的C++编译器。3.OpenCL－将针对一般CPU、GPI、FPGA所开发的OpenCL函式的C语言转换、移植。

以上HCC、HIP、OpenCL函式以至于Python底层，到MIOPEN、BLAS/FFT/RNG、NCCL、C++STL中间层与函式库都是开源(Open Souce)设计，并可搭配到最上层Caffe/CNTK、TensorFlow/Chainer、Torch 7/Theano、MxNet等应用框架。

锺文衡提到AMD提供以OpenCL函式或HIP编译器所撰写的MI Open最佳化深度学习函式库，内含摺积(Convolutions)、Pooling、Softmax运算，与数据常规化(Normalization)等常用的程序码片段，能搭配AMD GPU/APU平台并发挥最佳化深度学习的加速效果。而AMD Radeon Instinct具备的MxGPU所需的SRIOV硬件虚拟化技术，可搭配数据中心的服务器，虚拟出多个在不同操作系统独立操作、不受干扰的GPU机器学习加速环境。

锺文衡提到Radeon Instinct技术，搭配即将推出的14nm制程、Zen架构的Naples服务器处理器，可建构出低成本、低延迟架构、点对点通讯(Peer to Peer Communication)与高密集运算足迹(High Density Footprint)的数据中心。

AMD从2012年6月与产业界创立HSA异质系统架构基金会，公开跨CPU架构的ROCm开放运算平台，同时也是异质加速器互连架构(CCIX)、次时代汇流排(Gen-Z)与OpenCAPI联盟的创始会员。目前运用Radeon Instinct深度学习技术的实际产品，有Super Micro的SYS 1028GQ-TRT 1U机架式服务器。

关键字

超微机器学习自驾车

加入已选取到「关键字追踪」什麽是「关键字追踪」

商情专辑－2017嵌入式技术论坛专辑