Smart TV、STB带动嵌入式处理器朝多核心架构重点升级 智能应用 影音
工研院
member

Smart TV、STB带动嵌入式处理器朝多核心架构重点升级

  • DIGITIMES企划

3D影音的大屏幕播放应用,大幅考验智能电视、高端平板电脑、数码机顶盒的应用效能。Asus
3D影音的大屏幕播放应用,大幅考验智能电视、高端平板电脑、数码机顶盒的应用效能。Asus

嵌入式应用已不再是以往仅强调低功耗、低成本的产品开发方向,尤其是平面电视大举导入Smart TV智能电视应用后,对于嵌入式系统硬件的要求已呈现跳跃性成长,嵌入式系统不只要应付高度整合的高分辨率数码内容处理,还必须能满足3D GUI、3D电玩、1080p甚至未来4K x 2K的超高分辨率运算应用需求...

早期信息家电的应用需求,嵌入式系统扮演的角色仅为让单纯的家电多了电脑运算、储存与处理的能力,系统运算应用属于附加的辅助性质,最多也只是让家电具备简单的自动控制功能。

Tegra 3嵌入式方案的SoC虽以性能提升为主,提供4个可Variable SMP架构运行高效能核心,但也同时提供1组低省电低功耗核心,因应一般低运算需求的工作。NVIDIA

Tegra 3嵌入式方案的SoC虽以性能提升为主,提供4个可Variable SMP架构运行高效能核心,但也同时提供1组低省电低功耗核心,因应一般低运算需求的工作。NVIDIA

Tegra 3嵌入式方案所开发的microITX单板电脑方案,具备高效能、极低运行功耗优势,适合需大量影音娱乐处理的IA产品导入使用。kontron

Tegra 3嵌入式方案所开发的microITX单板电脑方案,具备高效能、极低运行功耗优势,适合需大量影音娱乐处理的IA产品导入使用。kontron

3D影音支持,也需要系统的加速处理支持来强化应用体验。Google

3D影音支持,也需要系统的加速处理支持来强化应用体验。Google

Tegra3 SoC本身即整合CPU、GPU与特殊应用DSP与影音处理硬件加速等核心设计,让整体可达到功耗与效能的极佳平衡。NVIDIA

Tegra3 SoC本身即整合CPU、GPU与特殊应用DSP与影音处理硬件加速等核心设计,让整体可达到功耗与效能的极佳平衡。NVIDIA

图为芯片的核心电子显微镜检视照片,可以发现运算核心占用SoC最大面积,其余为I/O、GPU与部分硬件加速器。NVIDIA

图为芯片的核心电子显微镜检视照片,可以发现运算核心占用SoC最大面积,其余为I/O、GPU与部分硬件加速器。NVIDIA

但IA(Information Appliances)应用在结合影音视听的跳跃性发展下,原本仅可勉强处理标准分辨率视听内容的嵌入式系统电算平台,还算能应付需求,但若要因应现有主流的720p、1080p视讯与互动应用,低于800MHz的单核处理平台在性能表现已遇到瓶颈,现有的主流因应设计方案多采用提高单核处理单元的外频,或是先用双核心1GHz的解决方案,应付产品的效能需求。

因应未来高清影音应用 嵌入式系统需在效能再升级

但即便是现有的主流嵌入式处理器方案,短期内因应1080p、3D影音的TV或机顶盒应用,还能勉强支撑其绝大多数的设计要求,但若需要进阶到高清录影、3D互动GUI(Graphical User Interface)、3D互动影音应用时,现有的单核或双核嵌入式系统平台,效能表现就显得差强人意,而现有矽芯片的制程改善也有其物理极限,短时间无法获得具效益的性能提升方案,反而利用多核SoC的设计方案,可以快速达到提升性能、低成本的性能升级目标。

针对此发展趋势,即便x86架构的嵌入式应用也期待能在TV与Set-top-box等视听娱乐应用方面,抢得原有嵌入式应用平台的市场占有率,但实际上即使Intel与AMD等x86处理器业者相继推出针对低功耗应用场合开发的解决方案,对嵌入式处理平台的影响仍微乎其微。

x86虽有多核方案 但功耗表现仍较ARM应用表现逊色

因为x86架构虽在效能与开发资源可具较弹性的应用条件,但实际上其性能提升也必须面对功耗与元件散热等问题需处理,不仅在料件成本会较嵌入式应用平台高许多,设计方案与现有广泛使用的嵌入式应用资源,要切入应用供应链也不似PC产业的产品应用导入这麽简单。

嵌入式处理器产品业者,如ARM已针对未来视听应用可能需要的高效能运算应用需求,逐步布局多核处理器、多核GPU的SoC整合方案,尤其以ARM本身的处理器IP即具备亮眼的低功耗表现,透过IP授权,可以让需求业者利用IP整合方式,满足需要应用效能的运算核心产品,以开发越来越多的多核心终端应用需求。

尤其是影音娱乐装置持续导入高画质影音内容,甚至可在TV或机顶盒应用高负载的3D游戏娱乐内容,随着这些数码内容数量提升,内容改变的不仅只有屏幕分辨率的持续增加,更大的影响是面对巨量视听内容需求的处理数据激增,对高效能的处理器与GPU的性能要求会越来越高,利用多核心的处理单元搭配多核GPU可有效纾解影像处理的运算瓶颈。

ARM Mali GPU多核设计 因应需求至多可选8核方案

例如ARM积极推出Mali系列的GPU IP产品线,除低端面对移动电话应用的单核、双核GPU IP在此先不讨论外,ARM以Mali 450MP多GPU图像处理器核心技术,来锁定智能电视与高端智能移动电话市场。

观察Mali新旧版本规格差异,Mali 450MP GPU相较于上一代Mali 400的效能检视,Mali 450MP GPU在Vertex Processing可负荷的影像数据处理量,新版产品IP可获得前代产品的两倍提升,Mali 450MP GPU IP视产品规划需求,可提供用户最高多达8核心的IP组合方案,Mali 450MP GPU不只在运行效能、元件功耗等多方表现超越前代Mali 400产品,同时新的GPU IP系统架构同步优化,已能将绘图处理的系统资源应用效能提升,同时利用新架构改善元件功耗和运算带宽降到最低。

为了让已使用ARM解决方案的开发商,能够快速延伸应用进阶版本的Mali 450MP GPU多核矽智财,Mali 450MP在性能提升的同时,维持与前代Mali 400架构设计预留可回溯支持的应用弹性,这对已经使用原有Mali 400 IP的硬件开发商,可以维持原有的IP架构快速升级至最多可达8核心的Mali 450MP GPU应用层次,轻松开发足以因应未来应用需求的SoC或硬件产品。

此外,为让Mali 450MP GPU IP充分发挥性能升级效益、缩短产品上市与最佳化效能的工程投入,ARM也针对Mali 450MP GPU提供针对最新Open GL ES 2.0的最佳化架构设计,加速应用的程序界面(Application programming interface;API)设计与Open GL ES 2.0兼容,降低新产品开发的技术门槛,同时也能强化实机的3D应用效能表现。

Qualcomm 4核Krait方案来势汹汹

此外,在嵌入式系统的多核处理器竞争下,通讯芯片商Qualcomm也选择采多核型态来快速提升产品效能,因应未来嵌入式系统的繁重多媒体处理要求!例如,近来发表的4核心Krait(原为Qualcomm的Snapdragon产品线,4核心设计方案研发代号Krait,为采行28nm制程、最高2.5GHz外频)。

与Krait搭配的Adreno 320也是效能提升的一大关键,因为此款GPU在Qualcomm宣称,相较前代新版本设计具15倍效能提升、功耗却表现接近!至于新款Krait 4核设计方案,性能约为前代产品的1.5倍,但整体运行功耗仅有往常的65%,代表省电性能更胜以往版本。从现有公布的数据可以了解,最新的参考设计虽是由LG的实作手机样品,但实际上这款参考设计硬件规格已有1280 x 768显示屏幕、芯片采28nm制程,并搭配Adreno 320 GPU等,至于处理器的外频为一般主流的1.5GHz设计,性能表现已经略具发展高端智能电视、机顶盒的效能水准。

目前应用最热门的NVIDIA Tegra 3嵌入式方案,基本上也是采取4核心的设计型态,相较前代的Tegra 2仅有双核方案比较,4核设计的Tegra 3号称网页浏览效能可以较以往提升2倍,同时Tegra 3整合硬件加速Flash播放设计,对目前大量的Flash网页应用更具有提速的效果,同时,为了满足效能提升、功耗压低的设计目标,Tegra 3也整合了第五代的省电设计。

Tegra 3除SoC里头搭载了整合式超低功耗(ULP) GeForce GPU外,原有的Tegra 3 四核心设计还追加一组第5颗省电CPU,作用在当高运算需求时,Tegra 3可以采可变对称式多重处理(Variable SMP)架构提供最大运算能力,视工作量动态调整4组核心配合运行组合,当处理低运算需求的工作时,则关闭高效能核心,仅以第5颗省电CPU来完成基本运算处理,达到最佳化电源管理的设计目标。

NovaThor U85XX 利用制造技术强化芯片性能与功耗表现

未来多核心Soc将会是一个趋势,但对基础的矽制程也受到时脉提高的应用挑战,例如ARM的多核心运用需朝高效能、降低耗能量来维持与x86方案的竞争差距,目前主流ARM器件已大量导入32nm甚至28nm制程量产、以SoC产品型态出货,而更进一步已有ARM产品开始采20nm试产、测试,更精密的制程预计会在2013年投入产品量产,紧接着还有低于14nm的制程测试计划,试图利用制程直接改善SoC的运算体质。

除ARM提供的多核应用IP外,在现有多个嵌入式处理器应用方案,同样尝试运用矽芯片制程强化运行效能,例如,整合LTE通讯应用的NovaThor U85XX解决方案,即号称可运用FD-SOI制程来让矽芯片本身运行时脉大幅提升,同时功耗也可压低。

在NovaThor U8540解决方案中,以FD-SOI制作技术可让外频运作时脉提高至2.5GHz,业者号称可达到以往近似设计的2倍效能!甚至在维持高效能运行的同时,驱动芯片电压也仅需0.6V就能驱动,而在最高效能运行模式所消耗的电能,也比同性能水准产品有超过30%的节能效果。