Lenovo与Intel携手创新数据中心架构
- 陈毅斌
在人工智能(AI)、5G 和高效能运算(HPC)等题材带动下,半导体业者竞相投入先进制程技术开发,为了持续改善良率、增进生产力,必须借重大数据分析技术建立多种模型,以解决各式制程问题,因而需要有强大 IT 系统做为后盾。
着眼于此,英特尔(Intel)与联想(Lenovo)于日前共同举办「Intel 创新数据中心架构助力企业服务器效能升级」研讨会,广邀工研院、益华电脑(Cadence)等业界专家,分享数据中心优化、AI 基础架构等议题,期望引领高科技业者的 IT 单位,懂得如何灵活提升运算效能、增储存容量,帮助研发单位加速设计新一代芯片产品。
Lenovo数据中心业务集团(DCG)中亚太区总经理 Han Chon 表示,DCG的愿景是成为最可靠的数据中心夥伴,成立两年半以来一直努力实现这个远大目标,不仅帮助客户推动智能化转型,更进一步解决人类面临的重大挑战,包括解决喂食短缺、早期侦测摄护腺癌、支持过动儿、预测危险天气、筛查视网膜病变…等等。自2017年至今DCG年年主推不同的转型方案,从1.0版最大的服务器、2.0版最大的储存设备,演进至今3.0版为最大的端到云产品组合;展望今后,Lenovo DCG将与更多台湾夥伴携手合作,协助高科技产业客户实现创新转型。
Intel台湾商用业务总监郑智成指出,上季该公司推出第二代Xeon可扩充处理器,不仅缔造出支持4.4GHz时脉、36TB存储器容量…等等创举,也兼具增强网安、内建AI推论加速功能(Deep Learning Boost)、弹性调整频率等三大特色;另值得一提,此处理器支持Optane DC持续型存储器技术,让存储器模块的最高容量攀升至512GB,远大过现行的128GB,同时也更为经济实惠、并有惊人的效能增幅,对过去一直受限在记忆容量的应用场景,可谓莫大福音。
Optane SSD 的DWPD 破60,大幅超越NAND
Intel应用技术经理萧景元接续登场,阐述企业与制造业服务器效能加速方案,重点在于Optane DC SSD;他强调此为全新技术,与大家熟知的NAND架构截然不同,举凡延迟时间低于10us、每日全碟写入次数(DWPD)超过60等等表现,全都完胜NAND。
更特别的,Optane不但可做为不会挥发掉的DRAM,也可当做延伸性存储器。由于完全不需执行NAND常见的Recycle、Copy、清垃圾等动作,仅会写入该写的地方、读取该读的地方,让其他地方不受影响,故Optane效能永不衰退或起伏,这点对于追求稳定效能的数据中心极其重要;此外用户可将Optane SSD转换为存储器,以利执行特殊的模拟运算软件,避免出现Out of Memory窘境。
来自工研院资通所数据中心系统软件组的朱怡虹博士、数据中心架构与云端应用软件组的陈明江博士,二人相继登台,先后介绍高速长效SSD储存系统管理技术、高效能深度学习训练系统。有关SSD储存系统管理技术,工研院主推Software Orchestrated Flash Array(SOFA),为纯软件定义储存技术,不仰赖任何特定硬件,若与标准RAID5配置相比,在4K随机写入场景,经实测SOFA的IOPS较RAID5高出十余倍。
另工研院考量DNN训练过程繁冗,犹如黑盒子艰涩难懂,所以为了简化流程、提升训练时效,设计出独特的深度学习(DL)训练系统,支持主流DL架构,具备超参数自动优化功能,也提供数据集管理、Training Jobs管理、模型绩效分析等实用功能,意在为开发者打造一个方便高效DL环境;工研院已基于这套训练系统、结合Lenovo ThinkSystem SR670 2U服务器而推出DNN Appliance。
凭藉Neptune等技术亮点,Lenovo搏得AI/HPC用户青睐Cadence
Cadence 资深应用工程经理 陈占霈指出,随着AI、机器学习、5G的驱动,预期HPC未来几年可望稳定维持高速成长。针对HPC、机器学习等主题,益华可以帮上忙的地方,便是提供EDA 软件核心引擎,透过演算法,尽可能把75~95% 大量Job配置为平行化处理,以提升PPA(Power/Performance/Area)。
而Cadence2019年重点之一,即是朝着整体系统的设计方向发展,推出的首套系统分析类产品为「Clarity 3D Solver」,若以5G为基准,该系统相较传统电磁场求解器,可展现12.3锫的电磁模拟速度,相当亮眼。 担任压轴讲者的Lenovo资深技术协理张博善,表示现在最新的HPC TOP500榜单中,高达35%、即是173个案例,都以Lenovo设备为运算基础;此外综观全球Top10超大规模用户(Hyperscaler),其中多达6家的运算系统系由Lenovo交付。
深究上述指标性客户青睐Lenovo,理由之一便是高稳定度,根据一项专业调查,遍布20余国750位CXO反应的「超过4小时非预期停机」事件,仅1% 发生于Lenovo系统,可靠度之高可见一斑。理由之二,在于 Lenovo拥有许多技术特点,譬如Lenovo水冷技术、LeSI可扩充基础架构、LiCO智能管理平台等等,皆是颇能吸引HPC/AI用户的亮点。
总括而论Lenovo将持续与Intel及台湾在地夥伴紧密合作,为半导体或其他高科技产业提供创新的数据中心与AI基础架构,俾使用户端的IT单位,能够灵活因应前端使用者需求,有效扩充运算设备,加快每一项芯片新产品的Time-to-Market 进程。(本文由陈毅斌整理报导)