协同开源5G、AI到边缘运算的开发设计能量 智能应用 影音
Event
EVmember

协同开源5G、AI到边缘运算的开发设计能量

  • 孙昌华台北

为了协助潜在用户、目标使用者与合作夥伴能更加了解开放运算计划(Open Computing Project;OCP)是如何为数据中心、边缘及其他应用服务带来效益,OCP基金会、台湾云端物联网产业协会/OCPT、工研院及台北市电脑公会遂特别在台北国际电脑展期间假台湾国际会议中心共同举办第一届年度OCP Taiwan Day。

从整个活动主打标题「通往5G、AI、边缘运算之路」,便能清楚了解本盛会会探讨多年来OCP基金会及其成员分别在5G、AI、边缘运算(Edge Computing)的协同开发成果与开源贡献。整个活动邀请了来自OCP基金会、工研院、微软、神云科技、台达电子、开放网络基金会(ONF)、Edgecore、Intel、纬颖科技及Yahoo JP等开源界巨头与专家,其阐述的内容主题包罗万象,从OCP计划及子计划内容成果介绍到AI边缘运算,从智能云端的创新再到打造智能、效率与绿能兼具的数据中心等议题。

效能、开放、扩展性与影响性兼具的开源贡献

OCP社群总监Archna Haylock指出,开放运算计划(Open Computing Project;OCP)社群共同推动许多计划与子计划,在网络计划下包含了ONI、开放网络安装环境(ONIE)、交换器抽象层界面(SAI)及云端开放网络软件设计架构(SONiC)等子计划。在机架与电源计划下包含了先进散热解决方案(ACS)、电源机柜互操作性(PSI)及Open Rack V3开放式机架等子计划。在储存计划下则有归档储存(Archival Storage)及Cloud HDD Fast Fail Read子计划。在服务器计划下推动了PCIe 3.0 Mezzanine卡、OCP加速器基础设施(OAI)及开放领域特定架构(ODSA)。

再者,在数据中心基础设施、电信及硬件管理等计划下分别有模块化数据中心(MDC)、openEDGE开放边缘运算平台及开放机架管理控制器(OpenRMC)等子计划。此外还包括了高效能运算(HPC)、开放系统韧体(OSF)及安全等计划的推动。至于OCP计划的生态系统则由会员、整合式解决方案商、供应商及代理商所组成。

长久以来,OCP社群持续成长,会员公司已达数百家,协同致力于10大OCP计划的工程师也达数千人。纬颖科技资深副总兼技术长张顺来强调指出,所有设计开源贡献与工作坊都必须满足4大OCP宗旨来自我验证,亦即效能、开放性、可扩展性及影响性。

纬颖科技总经理暨CEO兼OCP台湾主席洪丽甯表示,OCP台湾(OCPT)成立于2013年5月23日,是OCP组织内首个地区性社群之一,并担任推动台湾IT社群认知度的重要基石,其主要目标锁定在协同产业在开放设计上的相关作业,同时协助教育并推动来自各产业对所有OCP计划的付出与贡献。

工研院OCP认证测试中心于2014年授权成立。2017年年中左右,OCP Certified认证改以OCP Accepted及OCP Inspired两个认证接手,以扩大OCP的应用领域。2017年并成立OCP市集。

边缘云端成5G转型基础 AI边缘运算成为开源开发重点

OCP软件暨技术总监Rajeerv Sharma表示,到了2020年,联网装置数将会激增至200亿台,同时IoT将产生高达115 YB数据并撷取多达1,587 EB的数据。正是因为持续惊人成长的数据量带动了边缘云端的需求,2020年支持在网络边缘处理数据的IoT装置数量将突破56亿台。

边缘运算就是在此需求下逐渐蔚为风潮。根据Gartner的定义,边缘运算是分散式运算拓扑的一部分,其中信息运算位于靠近边缘处,装置与使用者会从中产生或使用信息。工研院资通所数据中心架构与云端应用软件组组长王启龙表示,所以云端运算与边缘运算是互补的,绝非相互竞争或排斥的关系。

边缘云端已经成为5G转型的一部分,根据Gartner研究报告指出,到了2020年,有3成已部署5G的服务供应商也会部署云端运算服务,有5成的企业数据会在传统数据中心或云端之外建立及处理。再者,边缘基础架构虚拟化并将其运行在边缘云端处,将成为5G得以推展的基础。

王启龙指出,AI加上边缘运算才是值得关注的商机所在,而AI边缘运算的关键基本组件包括5G或高速有线/无线网络、边缘数据中心运算,以及深度神经网络式影像处理应用。相关开发套件有主要用于推论的Intel OpenVINO,以及支持预测维护、异常侦测、机器视觉等广泛应用的Google Edge TPU。针对AI边缘运算适用的应用场域,大致包括智能影像监控、智能医院中的无人影像式病人监控及AI式医疗影像分析,以及次时代智能零售及智能制造。

Intel资深首席工程师Murugasamy Nachimuthu表示,Intel开放了许多有益于边缘运算发展的创新,包括线上管理、开放韧体及降低韧体复杂性、韧体韧性及机架与电源管理等方面的创新。

从硬件延伸至韧体安全的开源设计 打造异质系统弹性启动机制

台湾微软技术长丁维扬指出,微软在2014年加入OCP,随即在2016年于OCP服务器计划下推出自家次时代机架级解决方案Olympus专案,透过社群协同开发,边开放边完成诸如从机箱、通用电源分配器到档风板、加速器再到通用主机板等模块化硬件架构的设计开发,开启了开源硬件开发的新模式。

2017年,微软又发表了Olympus专案的延伸专案Cerberus,正式从开源硬件设计扩展到开源韧体安全乃至各种I/O元件,最终将信任网域根延伸至周边零组件中,并对外开放了此增开源规格。目前所有Olympus专案主机板皆支持Cerberus功能。此外,Denali则是微软于2018年释出的专案,该专案改变了大规模快闪储存的游戏规则,并推出基于EDSFF标准的创新SSD设计。

2019最新发表的Zipline专案为微软全新开源压缩标准,其压缩演算法同时适用于传统数据集(如系统日志)与「现代数据集」(例如IoT遥测数据),特别适用于网络数据处理、边缘运算、工业物联网(IIoT)及大数据分析等使用模型的开发之用。

当前系统韧体皆常驻在典型云端机架上各服务器节点中,但多半属封闭式架构,所以不同矽晶供应商各有专属版本的启动流程与矽晶界面,很难满足单一实作(Single Implementation)的要求,而且当前韧体开发模型无法跟得上多云端硬件供应商的脚步,于是OCP OSF子计划遂逐渐浮出枱面。

对此,Sharma表示,我们需要一个能提供各种异质系统弹性启动机制的矽晶界面韧体模块(SIFM),透过SIFM,使用者便可透过Intel或AMD的协助而从Coreboot(前身即LinuxBIOS)来启动Linux系统。使用者甚至可以藉由开源Linuxboot来启动Windows系统。

OCP能为DC提供省电、省空间与快速部署效益

OCP正在着手设计并推广机架与电源计划,其中一个重点子计划就是致力于机架管理的开放机架管理控制器(OpenRMC)。进一步而言,它是一台提供许多机架管理功能的专属硬件,可兼顾运算管理与机架层级管理。该控制器支持数据封包界面,举凡Redfish IT基础设施管理标准、Swordfish数据中心储存管理标准、I2C、WebGUI界面、IPMI管理界面及SSH协定等尽皆支持。

针对数据中心为何导入OCP的理由与重要性,神云科技OCP技术与系统负责人Hancock Chang表示,首先OCP提供优异的电源使用效率(PUE),其次是低PUE值带来的营运成本支出(OPEX)降低,其比传统机架服务器的OPEX低了35%,第三是OCP服务器的楼面空间占用率比传统机架服务器低了50%,最后,OCP无需工具的设计机制加速了数据中心的部署。

神云科技于2018年7月开源贡献了OCP ESA规格,该开放标准可让EIA标准机架与OCP解决方案搭配使用,而不需再重建传统服务器机房或数据中心,具备更佳电源节省、更少花费、更快导入、可互换性及可免除被特定供应商绑定等优点。

台达电技术总监Richard Chan就自家DC Falicity开发策略表示,目前该公司对DCIM管理需求,会从现有实时监控管理朝向透过机器学习建立容量过载预测机制,并支持PUE值建模与最佳化机制的策略方向发展。针对资本性支出(CAPEX)与OPEX降低需求,则拟定透过WBG装置达到98% PSU及UPS效率,以及透过电池管理系统来改善整体DC效率等策略。在可用性与可靠度提升上,则从现有备援设计及预警系统,进展到藉由机器学习、大数据及主动维护而打造的预测性维护机制。再就快速部署而言,则由现有定制化POD货柜式数据中心进展到货柜式高密度电源模块。

Nachimuthu表示,Intel致力开发高密度云端最佳化平台,并由Intel与浪潮集团开源贡献给OCP社群。另外,Intel并发表基于预测电力的数据中心散热解决方案,并计划开源贡献给OCP DC Facility计划。

Intel并针对OSF计划贡献自家开发的平台执行时间机制(PRM)、多插槽韧体支持套件(FSP)及Coreboot。再者,Intel并推出采用NVMe over Fabrics(NVMe-of)底层应用架构的储存硬件解构(Storage Disaggregation)功能。

纬颖科技副总经理暨技术长 张顺来博士表示,纬颖两相浸没式液冷系统可支持高达一百台OCP TiogaPass服务器主机板运作。整体系统设计不仅易于维护,且无须风扇、散热装置与额外机房空调。不但能达到较佳的PUE (Power Usage Effectiveness),相较于既有水冷技术,也可节省 40%电源花费。另外,整合48V与电源池(Power Pooling)技术,更可减少 93% 的12V电源传输损失。

OCP开源加持 带动5G高品质持续在线网络应用与服务

开放网络基金会ONF研究员Charless Chan表示,ONF是属于由营运商带动推展的开放原始码。其重要目标包括促使电信边缘云端能与开源软件、分离式硬件及云端科技相搭配。而CORD则是一个旗舰级综合大型计划,另外一个要点就是建置在CORD平台上的软件定义网络化宽频存取(SEBA)参考设计。

ONF并推展许多开源模块化元件,包括VOLTHA可将被动光纤网络(PON)抽象化成为可连接至SDN控制器的准以太网络交换器。Trellis则管理多用途分支-主干式交换结构(Leaf-spine Fabric)。次时代软件定义网络(NG-SDN)促使创新服务能与可程序化管线及统一界面相搭配。

Edgecore董事长暨CEOGeorge Tchaparian指出,随着5G时代的到来,带动了AI与边缘运算的发展,于是乎巨大的带宽需求被提前引爆。同时5G、AI及边缘运算的采用也会驱动新的期望与需求:持续在线、高品质网络与服务。如此一来会提升营运效率并推动超低延迟与智能应用发展。为了履行适当的CAPEX支出,让适当运算基础设施到位,并与像是开放性、白牌商业模式、硬件解构及自动化等正确的策略保持一致就变得非常重要。

张顺来博士指出,透过5G便能为各种新应用上带来OCP效益。OCP会与其他技术团体如Linux基金会及开放网络基金会协同合作以扩大影响力。其运营商会拥抱开放性让现成的设备商业化,而OCP也对3个5G所需的功能有益,亦即加强移动宽频的eMBBB、支持大规模机器式通讯的mMTC及支持超可靠及低延迟通讯的URLLC。以OCP的OpenEDGE规格所开发的边缘运算产品,可以扩大5G与边缘运算用户的生态系统与选择性。

2015年,微软发表专门用于软件定义网络(SDN)软件基础架构的操作系统Azure Cloud Switch(ACS),该系统支持OCP SAI界面标准,SAI标准被作为实现ASIC可程序化设计的标准化C API开发工具。隔年,为了让自家SDN软件能够轻松控管网络上所有硬件元件,微软率先加入OCP SONiC,并随即将这个网络交换器操作与管理的创新性突破对外开放原始码。

SONiC构建在SAI上,网络营运商可借此充份利用矽芯片、CPU、电源、连接埠密度、光纤网络与速度上的快速创新,同时保障了他们在跨越多平台之单一统合软件解决方案的投资。SONiC是第一个能将一整个交换器软件分解成许多容器化元件的解决方案,其并支持具备零停机时间的精致细密度故障复原与服务运行中升级功能。

透过容器化机制,营运商可以花最小的心力来外挂新元件,以及第三方、专有或开源软件,并因应特定情境需求来定制化SONiC。针对SONiC,微软接下来的目标就是希望能在数据中心内部全部支持SONiC,并扩展至网络及广域网络等角色的管理上。

OCP为Yahoo!JAPAN发挥可观成本节省效益 完全打破厂商锁定束缚

Yahoo!JAPAN系统管理事业群数据中心基础架构工程师藤见和英表示,为了降低硬件建置成本与营运负担,Yahoo!JAPAN决定在4年前开始导入OCP开放运算架构,随着OCP市场与生态系统逐渐完备与成熟,使得OCP服务器与机架的单位成本大降,该公司于是在两年前左右开始大量导入,如今该公司共有3个数据中心共超过4,000个运算节点全面采用OCP开放运算架构。

在这四年当中,Yahoo!JAPAN不但累积了丰富且宝贵的开放运算架构与技术经验,同时也为该公司带来了可观的成本节省效益,包括服务器单元上节省了29%、机架成本也节省了18%,再加上OCP开放运算架构完全打破了厂商锁定 (Vendor-Locking)的束缚,这使得公司在硬件周边及零组件的采购上变得更加弹性。由于OCP服务器与机架的部署需要较长的前置时间(Lead Time),再加上OCP机架尺寸比一般标准机架宽度更宽,所以导入上必须对机房空间配置进行慎审规划,目前Yahoo!JAPAN的建置策略是先以混合式架构为主,未来再逐步扩大OCP开放运算架构的导入比重。