智能应用 影音
Reserch
DFourm0722

AI应用需求推升新一代半导体运算架构持续创新

  • 魏淑芳DIGITIMES企划

GPU为内部设置大量运算单元,透过平行运算提升巨量数据处理能力,比传统运算架构更适合处理数值分析或人工智能应用。nvidia
GPU为内部设置大量运算单元,透过平行运算提升巨量数据处理能力,比传统运算架构更适合处理数值分析或人工智能应用。nvidia

新一代半导体制程受限材料物理极限,摩尔定律下的发展速度已有逐步放缓现象,反而是采人工智能新的设计概念、透过多元整合提供半导体软﹧硬件与系统的新优化方案。

摩尔定律(Moore’s Law)一直以来,均为半导体业界视为产业或技术发展圭臬,有趣的是在产制半导体技术关键的物理材料限制,在材料本身的最小化或是传导电性的极限所致,使得发展更密集、单位线径更小线路对应的半导体产品却越来越困难,即便从新的处理架构或导入新方案改善芯片微小化与高性能化的产品改善,但可改善半导体性能的空间已经越来越小。

突破现有运算架构瓶颈,使用新一代GPU来处理高效运算需求形成新应用趋势。nvidia

突破现有运算架构瓶颈,使用新一代GPU来处理高效运算需求形成新应用趋势。nvidia

人工智能、数值分析应用需求强劲,现有运算架构处理出现瓶颈,新一代为巨量数值分析/AI应用的运算需求平台相应而生,图为nvidia为AI分析应用开发的Volta GPU。nvidia

人工智能、数值分析应用需求强劲,现有运算架构处理出现瓶颈,新一代为巨量数值分析/AI应用的运算需求平台相应而生,图为nvidia为AI分析应用开发的Volta GPU。nvidia

追求微缩制程效益有限 成本问题影响高端产品开发

过往半导体业者多半以追求IC产品更小的制程节点,作为技术方案挑战的方向,因为半导体内部的节点越小,即表示内部的线路越小、更密集,而当单位半导体空间可以制作的线路越多、更密集,自然可以制作的晶体管数或是逻辑闸数量可大幅增进,这对于产制更高效能、功能更多的产品或芯片有极大的好处,而一向以来也成为半导体产业追求产品优化的主要方向。

但实际的现况是各种物理材料的电性表现都有其物理材料极限,虽然科学界一再实验探索新材料导入的可能性,但在发展全新材料的途径看似无法一时有大的突破,反而必须不同的思维路径来建构新的芯片开发方向,使用已趋优化极致的芯片基础下创建更优异的半导体运算或处理性能。

导入高端制程效益有限 对小型开发业者不利

当然,持续在材料科学下苦工使用更高端的制程或方法,在目前技术应用上还可以达到优化半导体产品性能的目的,但现实是投入优化制程的成本,可能已远高于半导体零组件的应用价值,这对于执着优化半导体的制程或更新颖的材料并不务实。

尤其是目前主流制程多落在15纳米上下,在制程的成本与效益才能达到应用终端产品的成本需求,仅有高性能、高容量要求的存储器或是处理器半导体这类高单价零组件产品,才会选择更小线径的高端制程,例如10纳米以下的进阶制程。

更大的问题是,当半导体制程挑战10纳米以下进阶制程时,其产制半导体的设备成本即呈现倍数翻涨,连带如产品制作良率也会大受影响,更具体的来看,弱势挑战如7纳米半导体制程,业界评估光是芯片投产就可能花费近1亿美元投入,芯片开发时程也会因此拖到超过1个季度才能有第一批样片产出,影响开发成本与时程甚巨,这也只有大规模的半导体产品集团才有能力投入。

另一个技术难点是当线径微缩下,半导体内部的漏电流问题也会更趋严重,小则影响半导体的功耗与稳定性表现,大则可能导致半导体零组件的耐用度寿命受影响,这对小规模的半导体业者会显得更难以进入高端芯片制程。

新颖运算架构 可为终端应用找到新解法

另一个角度检视,目前电脑或应用系统大致脱离不了von Neuman架构的基础,von Neuman架构也被称冯诺伊曼模型(Von Neumann model)或普林斯顿架构(Princeton architecture),但von Neuman架构基本是将处理器与存储器分开建置,当运算效能一般影响并不大。

随着运算效能骤增,系统将频繁运作将储存单元的数据传输至处理器进行运算与取得结果,频繁运行的状态下即导致运算效能被I/O瓶颈所限制,反而新一代以忆阻器memristor或类神经运算的结构,或许还有机会在有限的半导体技术限制下找到优化产品效能的蹊径。

另一个半导体产业思维,即利用GPU(graphics processing unit)高效运算特性,来处理如机器学习或进阶AI系统应用需求,GPU加速运算为使用图形处理单元再搭配CPU运算处理,藉由GPU的高效特性提供如数值分析、科学分析、工程应用等庞杂数据处理分析需求,透过将巨量数值高密集的分析工作负荷移转至GPU处理、同时藉由CPU处理常规运算的程序码。

检视这类机器学习或大量数值分析的运算架构,其实可以理解CPU为设置有数个运算核心主要处理序列程序码的运算需求,反之,GPU为拥有数千个运算核心的运算架构,可提供更高效率的平行运算处理资源,使用这类新颖架构也能在现有的半导体材料瓶颈下找到处理繁复数值运算的新解法,而这类运算架构目前已逐步落实在科学分析、人工智能、自驾车等应用场域。

AI应用需求骤增 大量数值分析需求推升新架构产出

未来AI技术应用,将会成为许多产业的应用驱动力,像是越来越热门的自动驾驶车开发技术,就导入了大量传感器、高分辨率图像分析的视讯串流AI处理分析,在分析影像的设计若全由中央处理器运作,现有的半导体技术开发成本将会居高不下,在技术商品化的方向可能成本就是一大门槛。

新的做法反而是将分析与数值处理的技术落在更前缘的数据取得端点,例如在撷取高端视讯串流时即预先处理分析,先以30f/s速度处理视讯预先分析预警,在于后端系统针对各个分析结果进行判断与处理,完整建构自动驾驶车应用需求的核心系统。

除了追求半导体新的制程外,半导体业界也尝试透过新的架构、电路、封装方法、演算法强化半导体的运行效能或使用价值,简单的说,就不会再是单靠优化半导体的内部线径微缩或是塞入更多的晶体管,来实现性能或功能的改善,反而必须透过更多的方法、技术方案与全新架构,重新检视应用系统的需求,透过系统的整体优化而不再将性能提升的关键全都落在半导体零组件上头。