因应巨量数据需求之高密集运算芯片发展趋势
数以百亿计的移动终端,仍须借助各种高速移动?无线区域网络,上传到云端供应商的数据中心做汇整、分析与应用,并藉由云端服务器甚至高效能运算服务器的平行协同统合运算,也进而推动相关运算芯片的核心架构、执行效能、制程与封装工艺的进化...
据Cisco VNI 2014预测,全球网络IP月流量将从2014年64.476 Exa Bytes,以年复合成长率21%速度,增加到2018年的131.553 Exa Bytes。
但云端运算,仍须藉由云端服务器甚至高效能运算(High Performance Computing;HPC)服务器平行协同统合运算,并提供云端前方几十百亿终端用户装置所需的服务。因此从部署于云端前线的架设方式(丛集运算、平行式运算),到所需要的处理器芯片,以及相关系统、API之间的整合,也得因应未来超高速网络封包传输,以及大数据?海量数据的实时分析、运算能力与日俱进。
以云端?高效能运算服务器的处理器芯片,均以先进制程来微缩线路间距,采取多达6~12核心+平行多线程(Symetric Multi-Thread;SMT)的64位元微架构设计,并且整合内嵌式高速存储器作为高速快取存储器与对外存储器汇流排的高速缓冲设计。所采用的芯片封装技术,也从MCP(Multi-Chip Package)多芯片封装、3D立体堆叠(3D Stacks)与2.5D中介板(2.5D Interposer)迈进。
像是IBM Power8系列、Oracle(原SUN) SPARC、英特尔(Intel)安腾Itanium 9500、XEON E3/5/7系列、XEON Phi系列、超微(AMD) Opteron与安谋(ARM) Cortex A57/A53等处理器。而辉达(NVIDIA)、超微(AMD)凭藉着其绘图处理器由于具备平行化多管线SIMD浮点运算能力,也成为建构云端?HPC高效能服务器辅助型处理器?界面卡。处理器厂商也跟服务器、SI供应商合作,不惜重心打造数以万计运算核心,达到百万万亿级运算(ExaScale)的超级电脑,要抢夺全球超级电脑Top 500排名可见一斑。
IBM Power8威力再现
由IBM华生研究中心所开发的效能优化增强型RISC架构延展出来的POWER(Performance Optimization With Enhanced RISC)处理器系列,曾攻占各种高效能工作站、服务器与嵌入式系统的心坎,也攫获过苹果PowerMac、PowerBook系列电脑的心,甚至Xbox 360处理器也有其矽智财IP的影子。
从1990年2月用于RISC System/6000工作站?服务器,1998年POWER3、POWER4从选择性到全面性实作64位元POWER指令集;2004年5月以130纳米SOI绝缘矽制程,打造双核心?平行双线绪的POWER5处理器核心架构,以四颗多芯片构装(Multi-Chip Module;MCM)而声名大噪。2007年65纳米SOI制程POWER6处理器首增加VMX指令集,时脉推进到4.7GHz。而2010年推出的POWER7首度内建8核心,但时脉降为3.2GHz;每核心执行四线绪,以及同样四颗实体矽芯片的MCM封装。
ISSCC’13国际固态电子电路研讨会上,IBM正式发表POWER8处理器架构。其以先进的22纳米SOI绝缘矽制程打造,集结15道金属电路层,矽晶电路面积为650mm2,运作时脉高达4GHz。POWER8处理器采6~12核心设计,每个核心采8线分派?10线发送?16个执行单元(8 dispatch/10 Issues/16 exec units)设计,可平行执行八个线绪(8 Threads),并且具备32KB L1指令快取、64KB L1数据快取与512MB第二阶快取存储器容量。12个核心之间以相互连通的96MB eDRAM作为第三阶快取存储器,可外接128MB eDRAM做为L4快取架构。
POWER8处理器除了时脉、制程与核心数量的增加之外,在于编码与存储器扩充性的强化,处理器内建PCIe 3.0汇流排控制器原生电路,光搭配16线道(x16 lane) PCIe界面卡时,双向传输带宽达到32GB/s。同时POWER8改为多核交易型存储器(Transactional Memory)架构,并首度提供协同加速处理器界面(Coherent Accelerator Processor Interface;CAPI),能让协同处理器芯片快速直接连通、取得POWER8快取内容来做协同运算。
2013年8月IBM与Google、Mellanox、NVIDIA及泰安电脑(Tyan)宣布合组OpenPOWER联盟,推广IBM Power处理器架构的平台朝开放发展。可程序化逻辑闸阵列(FPGA)大厂拓朗半导体(Altera),该年11月宣布支持OpenPOWER联盟的OpenCL软件开发套件(SDK);辉达(NVIDIA)于2014年4月宣布Q4在其最新时代绘图加速器(代号Telsa)的平行运算程序平台界面(Compute Unified Device Architecture;CUDA)中加入对POWER8的支持。
由IBM带领NVIDIA、Altera、Google等重量级大厂所筹组的OpenPOWER联盟,在云端?高效能运算市场开始攻城掠地,成为英特尔不能忽视的对手。
甲骨文?富士通SPARC64 X+
强调可延展性处理器架构的SPARC(Scalable Processor ARChitecture)处理器,由美国昇阳微电脑(SUN Microsystems)于1987年所开发,跟MIPS、IBM POWER系列同属80年代知名的精简指令型(RISC)架构的处理器。由SPARC系列处理器建构的工作站?服务器平台,执行由昇阳自行开发的Solaris操作系统。随后昇阳将SPARC处理器IP智财转移到子公司SPARC国际,逐步朝向架构开放,并授权给像是日本富士通半导体(Fujitsu semiconductor)、现代微电子(Hyundai Electronics)、Cypress、C-Cube、LSL Logic等作为服务器?工作站?嵌入式处理器的应用。
昇阳自家工作站?服务器使用的SPARC Tx系列处理器芯片,过去均交由德仪(TI)代工生产,而取得SPARC处理器IP电路授权的富士通,依自身需要来投单制造大型工作站?服务器所需的SPARC64 X系列处理器。甲骨文(Oracle)于2010年1月以74亿美元并购昇阳微电脑(SUN Microsystems)并取得服务器处理器?平台等硬件技术,开始追加SPARC M系列服务器芯片。
在2013年Q4,富士通发表以28nm制程制造的16核心SPARC64 X规格。工作时脉达到3GHz,每个核心可执行两个线绪(2 Threads/core)。每个SPARC64 X CPU具备128KB的L1快取存储器(64KB指令,128KB数据),L2快取存储器容量最高到24MB。富士通设计了可安插多达64个处理器模块插槽(64 Sockets)的SPARC64 M10系列服务器,单一服务器系统最多可同时执行2048个平行线绪。而今年将推出相同28纳米制程、同为16核心但微调时脉到3.7GHz的SPARC64 X+处理器,明年(2015)将推改采20nm制程的SPARC64 Xifx处理器,但时脉规格、核心术语与晶圆面积则未确定。
英特尔八核心Itanium 9500系列
2012年秋季IDF开发者论坛中,英特尔正式发布其IA64架构的Itanium家族的最新成员—Itanium 9500系列(原始代号Poulson)。采32纳米制程,工作时脉范围为1.7~2.53GHz;具备4~8核心设计,每个CPU核心具备独立的256KB D-Cache与512KB I-Cache,6MB L2快取存储器,以及八核心共享的24~32MB L3快取存储器,设计功率为130~170W。
以最顶级的Itanium 9560处理器来说,具备8核心加上每个核心具备平行多线绪(Simultaneous Multi-Threading;SMT),因此1颗8核心Itanium 9560就等同于16-Way SMT、16颗逻辑处理器或执行16线绪的执行能力。既有的Itanium服务器系统,可藉由换装Poulson处理器卡匣的方式,升级到16路芯片多线绪等级的平行运算能力。
Itanium家族是采用迥异于目前PC/NB的x86/x64架构的EPIC(IA64)指令集架构的特性,从电路设计上剔除掉以往过于复杂的非循序执行(Out of Order Execution;OOOE)指令解码?分派电路,藉助外部编译软件以及内部超长指令集架构的相互配合,把软件程序码编译成执行单元指令互不冲突的指令群,藉以发挥出超长指令集(VLIW)平行处理的效能。
受限于IA64核心架构的OOOE非循序执行特性,许多执行绪无法藉助硬件来均分派每个逻辑处理器,因此Itanium服务器每一次处理器硬件架构的时代交替,无论是核心数或线绪数的升级,都必须仰赖编译器重新针对不同核心的Itanium特性重新编译并做排程最佳化,才有可能充分发挥其多核多绪的执行效能。
由于架构在中端与入门服务器市场上,由英特尔自家小师弟XEON E3/5/7系列服务器处理器所把持,目前仅剩惠普(HP)有推出采用Itanium处理器架构的云端服务器?高效能工作站。甲骨文(Oracle)曾基于策略考量,于2011年3月宣布不再针对Itanium的IA64服务器架构去开发软件,导致被惠普一状告上法院,并在2012年8月由法院判决强制Oracle须继续对惠普?英特尔安腾(Itanium)服务器平台架构持续进行软件移植?支持的工作,云端?高效能服务器的战火猛烈可见一斑。
- 琳得科展出半导体封装制程新提案
- 着眼建厂商机 SEMI全球首办厂房设施论坛
- 研华于国际半导体展展出智能化数据采集方案
- 技鼎于半导体展发表MEMS探针与探针卡技术
- DDR4、NAND Flash存储器芯片发展趋势
- 因应巨量数据需求之高密集运算芯片发展趋势
- 实现安全互联 企业联网将扭转营运观念
- 立端科技成立物联网平台事业群 宣示已为物联网时代做好准备
- AOI设备提升FPD、晶圆、PCB产业检测品质
- 铁电随机存取存储器具效能、低功耗与保密性
- 穿戴应用导入多传感器 兼顾低成本低功耗要求
- Entegris推出新型VaporSorbR化学滤网
- 巨沛展出下时代最先进机台、技术与材料
- TSV技术持续突破 可望提升3D IC异质架构应用
- 大陆政府加码投资半导体 太阳能产业进退两难
- 半导体资本支出连年扩张 SEMICON首办高科技厂房论坛
- EDA技术缩短集成电路开发、验证与上市时间
- 先进封装技术领头 材料设备商各擅其场
- 永光成功进入穿戴式产品供应链 供应关键光阻剂
- 思达推出整合性3D IC精密参数自动测试设备