DCIM穿针引线 打通智能机房任督二脉 智能应用 影音
工研院
ADI

DCIM穿针引线 打通智能机房任督二脉

  • DIGITIMES企划

透过DCIM解决方案,将有助于企业信息机房管理者时时掌握各项基础设施的状态;图为Raritan dcTrack的电源路径分析示意图。来源:Raritan
透过DCIM解决方案,将有助于企业信息机房管理者时时掌握各项基础设施的状态;图为Raritan dcTrack的电源路径分析示意图。来源:Raritan

随着IT技术发展,及各式管理工具的应运而生,好不容易使得IT设备、机房基础设施等两造管理单位,不再像是楚河汉界,而可透过一致的界面,跨越不同设备之间的藩篱,得以互通彼此的信息;个中的关键驱动力,源自数据中心基础设施管理(DCIM)解决方案。

回首过去,一座信息机房之所以从无到有,接续繁衍出空间布置、机电、空调、消防、门禁、安全监控、IT基础架构…等所有元素,靠得并不是单一个人或团队,而是多不胜数的团队,其各自秉持不同的专业知识、逻辑概念,藉由不同的专案,分头建立一部分的机房组成元素;比方说,在此之中有负责机电的团队,也有负责空调的团队,当然也有负责IT基础架构的团队。

等到许许多多的团队,各自执行完成不同任务,这一个个成果的加总,最终就是完完整整的信息机房;然不可否认,论及机房的规划、设计、建置及竣工,的确是一段重大历程,但后续的维运与管理,其实才更加重要,因为唯有好的维运与好的管理,方能确保机房真的是一个可靠的基础构造组织,恒常保有高度的安全性、完整性及功能性,终至成为企业驱动商务运作的强力后盾。

看到这里,察觉到何等问题?含括IT基础设施维运、资产管理、水电空调管理、能源管理、连接管理、环境控制、安全监控、门禁管制、空间配置、变更管理…等各式各样存在于机房的环节,背后都是由不同团队、专业知识、技能、逻辑概念所催生,尔后进入维运管理,彼此所适用的管理工具,当然不尽相同,影响所及,IT与非IT等不同资产之间,也被硬生生树立了好几座分隔岛,机房管理者纵使有综观全局、通盘管理的决心,也必须动用多套管理软件、熟悉多个使用界面、费心比对不同属性的数据、厘清各种设备的告警模式。

费尽千辛万苦之余,总算大致掌握了不同层面的管理要领,但真正的考验,绝非日常承平之时,而是遭逢事故的当下,这些性质互异的设备或设施,能否在危难之际、有条不紊地连动响应?令人遗憾的,答案还真是否定的,也就是说,当市电中断、UPS开始接手供应电力,然电池即将耗尽,IT管理者这一端,未必能实时知悉;当空调系统故障、后续将导致机房内部温度飙升,服务器正一步步走向过热跳机的濒死道路,IT管理者这一端,未必能实时知悉;当保全系统察觉可疑刷卡记录、研判机房已有不明人士潜入,IT管理者这一端,同样未必能实时知悉。

然而上述看似与基础设施有关的事故,最终都极有可能损及信息设备,乃至于无形的软件、数据等珍贵资产,IT管理者岂能不在第一时间掌握所有状况?但他真的能吗?其实很困难,因为依现行运作机制,根本不可能做到跨设备的自动响应。

DCIM跨越鸿沟  使IT与基础设施得以协作

而当DCIM(Data Center Infrastructure Management)开始现身,原本存在于传统IT与设施人员之间的鸿沟,得以迅速被填平!只因为透过DCIM,机房管理人员就得以实现信息设备与基础设施之间的协同运作,当事件发生,所有设备与设施都能连动响应;更重要的,管理者也可藉由不同设备与设施数据的汇总,做到跨设备事件分析,洞悉许多不良现象的前因后果,从而制定改善策略,避免日后再次发生,致使信息机房运作效率更趋良善。

业者指出,DCIM整合管理系统,有能力监视与控制所有基础设施,而此监控能力奠基在一致性的使用界面、数据格式、告警机制、权限管理之上,管理者再也无需翻山越岭频频穿梭不同管理工具,连带所获最显而易的好处,便是提高信息设备的可用度。

所谓可用度,IT人通常会采用一道公式予以表示,即是MTBF除以「MTBF+MTTR」,其中MTBF意指平均故障间隔时间,MTTR则代表平均修复时间,所以若能借助DCIM掌握所有基础设施的运行状况,一方面就可望提前发现疑难杂症、及早介入处理,俾使让基础设施恒常维持正常运行轨道,连带减少信息设备停机风险,二方面纵使在所难免遭逢突发事故,亦可掌握实时信息,并且快速定位问题,而不会好比从前像无头苍蝇般不知所措。

也就是说,透过DCIM这个跨足基础设施与IT系统的统一管理平台,将裨益管理者更易获得管理所需之信息或数据,进而根据这些信息或数据加以分析、产生智能决策,终至实现全面优化机房管理的宏大目标。

一旦有效实现上述目标,显而易见的,MTTR必然可以减少,而MTTR数值只要缩小,则上述计算可用度的公式分母,也就跟着变小,连带造成可用度的攀升。

动态PUE量测  充分满足电力管理需求

细究DCIM的功效,尽管可能因不同厂牌系统产品,而有若干歧异,然万变不离其宗,只要是DCIM,理应都具备一些共通的基本功能,单凭这些功能,已可让企业机房管理者受用无穷。

不同厂牌的DCIM解决方案,无论功能模块是多或寡,皆会有一个基础运行平台,它具有一个图形化界面,可藉由机房平面图的铺陈方式,让管理者一目了然各项设备的状态信息,每当有告警事件发生,管理者就能轻易从画面中看出事故发生的位置,借此快速厘清告警的定位点,此时系统亦将根据基础运行平台所保留的事件记录、历史数据、排程管理、警报响应原则,协助产生一个最适化的处理建议,协助管理者利用最短时间排除当下的告警事件。

除了基础运行平台外,每套DCIM方案都能提供攸关于电力管理的功能模块,使得管理者能借此获致动态PUE量测数据,并可与历史PUE发展趋势做比对,以了解当下PUE是处在正常或异常状态,假使察觉异常,接着可透过逐层钻取(Drill Down)程序,依据能耗的功能性分类,快速找出最亟需改善能源使用效率的症结点。

更有甚者,不少DCIM亦可利用系统所汇集到的kWh数据,进一步执行电价分析,其电价计算基础,可依照时间区段之不同,实际对应到台电费率,故可推算出相当趋近实际电价的费用结果。

另一项多数DCIM都具备的共通功能模块,即是资产管理。以台达电的InfraSuite Manager为例,其资产管理模块可呈现设备位置、额定信息、电源、网络与维护信息等详细信息,一方面可协助管理者执行必要分析与预测,好让基础设备与服务器都能被装设在机柜内的最佳位置。

至于另一方面,管理者亦可善用电源路径图,详加追踪各项设备配电的上下游关系,含括从最前端的市电输入、配电,一直到末端服务器、储存设备、网络设备等用电装置的完整历程,如此一来,当某台供电设备失效,后续对于IT设备将造成何等冲击或影响,都可藉由事前的分析而预见,俾使管理者知所因应。

更重要的,透过DCIM资产管理功能,也可促使基础设施与IT设备紧密整合,甚至能与虚拟机器的管理系统绵密互动,达到最佳化的移转效果。举例来说,当某一承载企业关键应用的虚拟机器,所处在的A机柜出现供电警报,此时即可藉由DCIM与虚拟化管理软件的连动响应,自动将该虚拟机器迁移至供电正常的B机柜,借此维系企业关键应用服务的正常运转,单凭此例,即不难看出DCIM的巨大效益。


关键字