备齐SOP/EOP/MOP文件与DCIM系统 建立完整维运管理机制
目前担任台达电子资通讯基础设施事业群关键基础架构事业部台湾区业务部经理的林士基,亦是台湾智能能源产业协会(TaiSEIA)理事长,在协会成员共同努力下,一方面让TaiSEIA 101标准(智能家庭之装置互连协定)成为国家标准,二方面亦对绿色机房议题着力甚深,几年前推出机房建置指引书,下一步将力推OM Ready(Operations & Maintenance Ready)理念,让用户在面对每项机房系统与设备时,都清楚如何实施维护与保养。
林士基指出,OM Ready为维运无缝接轨之意,不仅设计端基于机房永续维运之目标而执行设计规划,施工阶段亦须基于相同的永续维运目标,执行诸多事务,例如设备何时进场、性能测试结果如何,相关数据都应该备齐,做为日后维护保养的重要依据。
设备性能测试,有助企业提升机房维运软实力
就机房设备供应商角度来说,首先必须将厂验(FAT)、单机测试(SAT)、功能测试(FPT)、整体性能测试(IST)、确效验证(VMP)等等所有该执行的测试程序做好做满,这点非常重要。以FPT为例,也许不少人认为既然做过FAT与SAT,便已充分证明设备确实可用,为何多此一举执行FPT测试?但每个用户环境不一,且设备在安装、运送的过程也难保没有闪失,故有必要在现场安装好设备之后,接着将负载送上来,按用户端的实际状况执行操作,实地测试设备性能是否如同当初的设计要求。
以空调箱温湿度控制系统来说,往往在历经一段时间过后,泵浦(Pump)电流值就可能偏离当初缺省水准,如果不经测试,就会让这个误差持续存在,对于日后机房维运产生不利影响。过去用户鲜少要求厂商执行相关测试,然而随着OM Ready的推广,期望促使这些测试成为机房施工阶段的必经程序,只因这些测试对于用户端负责系统维运的操作工程师非常重要,蕴含诸多无形价值,做过几次测试、累积Template文件后,就会更了解系统操作流程,继而提升软实力,更懂得如何善加处理机房维运事宜。
除了测试外,设备供应商另有重责大任,需要负责产出标准作业程序书(SOP)、紧急作业程序书(EOP),以及维运作业程序书(MOP)。林士基进一步说明,这些作业程序书对用户极其重要,有了SOP,便可清楚掌握设备从现场开关一路到负载端的明确操作流程;有了MOP,即知道该如何针对设备做检查、清洁保养;有了EOP,在面对设备异常时就不会惊慌失措,也不会一味只想着致电厂商求救,多数情况下只要根据设备的灯号状态,就能从EOP文件中按图索骥,找出问题症结点,然后自行予以排除,如果问题较为严重,也可在与厂商技术人员电话沟通的过程中,明确告知问题状态,俾使技术人员一到现场便能以最快速度直接排除错误,而非费时查找故障原因。
凭藉维运管理手册,第一天便可上手营运
值得一提的,前述SOP、MOP及EOP等文件,并非任由个别设备商各写各的,而是需要由专案的系统整合商或统包商加以整合,连同资产管理DCIM、环控监控BMS等系统,一并纳入机房永续维运管理机制,务求让机房维运人员能一目了然,在第一天便可轻松上手营运。
举例来说,不断电系统(UPS)必须接到配电盘,而配电盘还会往上串接发电机,若仅由UPS、配电盘、发电机各自产出文件,彼此间缺乏统合、串联与对应,那麽用户就算看完三份文件,可能仍旧摸不着头绪;但如果藉助一套完整维运管理手册,举凡发电机、配电盘、UPS乃至配电工程等不同环节的文件都会加以整合,当用户遭逢机房电力问题时,就比较容易探查是哪个环节出状况,也知道如何按照缺省的标准步骤来排除故障。
综观现今一些较符合OM Ready精神的建置案,台达电子参与的频率不低,但因应不同个案可能扮演不同角色,有时提供整套基础设施,有时仅提供DCIM(Data center infrastructure management);而DCIM肩负设备资产管理任务,所有攸关设备进场、安装、效能测试等等数据皆由DCIM系统掌控,重要性不言而喻,机房设备总有来来去去,有些新设备需要被纳管,有些旧设备若发生异常则需要做告警排除或产出维修工单,凡此种种,过往用户都会急Call厂商协助解决,今后即可透过维运管理手册,帮助用户练就DCIM自主管理能力。