勤诚震撼亮相2024 OCP峰会 展示DC-MHS与MGX模块化服务器方案
每年秋季在美国加州圣荷西举行的OCP全球峰会(OCP Global Summit)是全球开放运算社群的一大盛会,聚集了业界领袖、研究人员及先锋共同探讨OCP专案的最新进展,分享未来挑战与创新机遇。今年的2024 OCP全球峰会于10月15日至17日举行,主题为「从创意到影响力」,强调OCP在加速回应新兴趋势与市场需求上的创新承诺,推动数据中心产业的开放性、效率、可持续性与扩展性。
实际走访OCP峰会现场,不难发现各家业者无不积极大秀实力,现场展出最新服务器方案,身为全球服务器机壳领导厂商,勤诚兴业于本次OCP峰会中展示基于OCP DC-MHS架构的最新一代服务器方案,并推出基于NVIDIA MGX架构的AI服务器机壳产品,现场更可在不同展位看到勤诚的与不同系统厂及品牌厂合作开发的新产品,勤诚积极助力客户加速新时代产品的研发与上市,抢占市场先机。
前进OCP Summit,展示新时代服务器方案
勤诚全球研发及产品开发处协理张鹏程表示,OCP(Open Compute Project)是由Meta(当时为Facebook)、Intel、Rackspace和Goldman Sachs于2011年共同创立的非营利组织,旨在推动开放式数据中心硬件架构,为会员及业界推广产品设计和实务应用。
OCP最初的目的是为内容或应用服务的云服务提供商(CSP)提供即用的硬件解决方案,当时Meta受益最多。由于其庞大的需求,OCP逐渐发展成一个强大的社群组织,对整个IT产业产生了深远影响。像OCP的I/O模块规范和OAM架构等技术已被广泛认可和采用,例如OCP I/O模块已成为数据中心的标准,NVIDIA的HGX与OAM架构相辅相成。其他CSP如AWS、微软和Oracle虽未完全采用OCP架构,但也参考了相关规范,催生了许多「OCP Like」产品。
张鹏程认为,随着标准OCP产品及OCP类产品的发展,OCP已成为全球最具影响力的标准行业组织之一,涵盖了从上游的IC公司如Intel、AMD、NVIDIA,到中游的CSP、ODM/SI业者,再到下游的零组件供应商。这也是勤诚2024年决定参加OCP盛会的重要考量之一。过去,勤诚主要协助客户参展及产品展示,而今年则希望透过此盛会积极成为行业中的关键角色,因此,除了在OCP峰会上展示了新一代服务器机壳解决方案外,勤诚也在评估加入OCP委员会,以期为IT产业做出更大的贡献。
DC-MHS与MGX,融汇于OCP生态圈
DC-MHS(数据中心模块化硬件系统)是勤诚在此次展会的核心展示技术之一。此技术的目标是制定开放规范,构建一个具有弹性和可扩展性的生态系统,以应对现代数据中心日益增长的运算、传输及储存需求。DC-MHS的发展历程可以追溯到早期的ATX和SSI标准,其目标是在更高效的硬件环境中满足数据中心的通用需求。
自2010年以来,SSI 规范逐渐无法满足高效能数据中心的需求,业界开始转向各种专有规格。然而,随着需求的集中化,越来越多的企业选择聚焦于开放标准。最终,DC-MHS的初步框架于2020年确立。
勤诚与Intel合作开发了首个DC-MHS概念验证平台,并与众多的ODM和SI业者合作,推出了多款基于该平台的通用运算产品。随后,AMD也加入了DC-MHS生态系,Dell和HPE的加入更进一步加速了标准的发展和普及。
DC-MHS与OCP(开放计算专案)标准的结合进一步推动了其发展,使云服务提供商(CSP)的需求得以纳入,最终促成了OCP新标准SDNO的诞生。勤诚现已全面支持SDNO,并与主要的IC公司、OEM厂商及系统整合商密切合作,推动这一新标准的普及和发展。
此外,勤诚针对AI应用的MGX产品也与OCP SDNO标准紧密相关,与DC-MHS形成互补。无论是DC-MHS还是MGX,双方都在不断加强与OCP的联系,依托这一生态平台,推动数据中心解决方案的多样化发展。
「虽然各企业的起点不同,但面对的挑战和问题却有许多共通之处,因此解决方案之间存在相似性。」张鹏程表示,「这些共通点能够整合为行业共识,进而形成标准化的解决方案。这就是为什麽现在正是最佳时机,我们需要更加积极地推广基于DC-MHS和MGX平台的关键产品,提升市场认知,让这些产品触及更多潜在客户。」
拥抱好的架构,健康有序迎向可预见未来
DC-MHS 的发展由两大规格支撑,分别是FLW和DNO。FLW主要针对双插槽(Dual Socket)规格,专为满足高效能运算需求设计;而DNO则偏向单插槽(Single Socket)设计,目标是支持主流应用,尤其是在多I/O应用场景下发挥更大作用。
后续推出的SDNO继承了FLW和DNO的架构,并进一步加入了更多云服务供应商(CSP)的需求,预留了更多灵活性。从DC-MHS到SDNO,两者在设计理念和规格上保持高度的互通性。例如,许多知名品牌的 1U及2U通用服务器产品,大多基于 FLW 架构,并发展出「Dual Socket + 32 DIMMs」的高性能配置。相较于FLW,DNO的尺寸约为其一半,但在此空间中为更多I/O配置提供了支持,特别适合GPU应用场景。
以 NVIDIA MGX 架构为例,最新的产品 GB200 就是基于 DNO 架构设计。MGX 为 CSP 客户提供 1U及2U 尺寸的服务器应用,如年初推出的 NVL72 将 1U Compute Tray部署在单一机柜中,最多可承载 72 个 B200 芯片。NVL36 则为 2U Compute Tray应用的延伸。在企业应用方面,MGX 提供的 2U 独立机型可支持传统的 PCIe GPU 卡,最多可配置四张 GPU 卡,并支持气冷散热。此外,MGX 也提供 4U 机型,能承载 8 到 16 张 PCIe GPU 卡,同时支持气冷或液冷散热。MGX 的产品组合涵盖了从密度要求较高的 1U 到2U 和 4U 产品,有气冷或液冷的不同散热模式,可应对不同的应用需求。
张鹏程强调,无论是 DC-MHS 还是 MGX,都是一种架构(Architecture)。勤诚正在基于这些架构建设生态系统,这些架构为不同的应用场景提供支撑。正是有了这些架构与标准,整个业界才能在共同的规范下健康、有序地发展应用。勤诚今年特别由CEO陈亚男亲自领军带队参加OCP峰会,勤诚计划与上下游合作夥伴共同发展这些生态系,从而为终端客户提供更好的服务,并引领未来的技术方向。