从可共同维护性看机房设计实务 智能应用 影音
Microchip Q1
ADI

从可共同维护性看机房设计实务

  • DIGITIMES企划

广知工程科技股份有限公司 总经理 吴沧荣
广知工程科技股份有限公司 总经理 吴沧荣

机房在早期建立之际,其实并没有任何国际规范或认证,因此往往在施工完成后,许多问题浮上台面时,善后事宜可能会衍生许多不必要的成本及时间,所造成的损失更是不计其数。

广知工程科技技师总经理吴沧荣指出,其实所有部件的表现、所有管线的设计、可能会出现的冲击点,都应该要在设计阶段时就要先做好或找出来,在施工前就能够完全掌握,如在高架地板里面要如何配置等,最后才能达到第III级「可共同维护性(Concurrently Maintainable)」的要求。

吴沧荣指出,虽然初版的TIA942「数据中心通信基础架构标准」早在2005年即已颁布,但在台湾仍算是很新的概念,真正深入了解的人有限。吴沧荣强调,许多机房所碰到的问题,如空调设备故障时,机房在60秒内,可能就会因为过热产生故障,其实问题出在设计,参考TIA942,就可以得到解答。

数据中心基础设施分级认证标章(Tier Certification)的申请,是由Uptime针对基础设施的可用性,定义出四种不同等级,分别对应可用性及年平均故障时间。第I级的可用性为99.671%,年平均故障时间28.8小时;第II级的可用性为99.741%,年平均故障时间22小时;第III级的可用性为99.982%,年平均故障时间1.6小时;第IV级的可用性为99.995%,年平均故障时间0.4小时。

第I级的设计只要做到基础建设要求,如现场的服务器需要多少制冷设备来维持合理的运作环境即可;第II级就会要求冗余容量(Redundant Capacity)设计,一旦主机故障时,会有另一台主机启动接手,但管线本身仍然没有做冗余设计。

吴沧荣指出,第III级要求的「可共同维护性」,是指有设备故障时,可以因为有备载容量及双回路设计等,而能在现有系统保持正常运作的情况下,完成维修工作。

由于第II级及第III级的成本价差不大,而第II级及第III级两者之间的年平均故障时间差距却高达20.4小时,吴沧荣因此鼓励业者,应该要直接锁定第III级认证。但要达到第IV级的要求,必须要做到连续冷却、实体区隔等设计,而且系统必须能够自动侦测错误,自行回复正常执行的状况,全自动化所要付出的成本,可能是第III级的一倍,但两者的年平均故障时间差距,仅有1.2小时,因此业者要做好评估,那种等级最符合需求。

至于分级认证程序,Uptime Institute主要是以阶段性认证方式进行,第一阶段为设计规划认证,认证范围包括设计图、系统架构、操作性能、维护性能及扩充性能检讨,经审查认可后,Uptime Institute会颁发设计等级认证书;第二阶段为建物现场勘查认证,范围包括整体机电设施的功能认证及测试与检讨。第三阶段为经审验认可后,Uptime Institute颁发设计等级认证书及牌志。

吴沧荣指出,其实机房运作一直潜在着风险,如果没有事先设法避免,如接头、电线、电缆、电池或电容器的生命周期维护,或是预留维修空间,甚至可能只要有一个小小的风扇故障,都可能导致机房运作发生问题。

此外,如果机房设计两条通讯路径,但如果两条线路经过同一个空间,却因为这个空间发生事故而同时故障,一样不符合第III级的要求。吴沧荣因此指出,要符合第III级的要求,就一定要做好实体区隔。

但台湾很多机房建置案,基础建设仅占预算30%左右,建筑师不了解实体区隔的重要性,又没有足够的预算施工,机房设计也就难以达到认证要求。吴沧荣指出,其实正确的实体区隔,初期的建置成本并没有很大的差距,但对于后续的维护成本,却会产生重大的影响,是机房设计实务,必须努力推广的方向。