边缘装置串流分析 助企业摆脱非预期失效的千万损失
众所皆知,机台设备一向是制造业倚重的生财利器,以半导体业前段的晶圆代工或DRAM厂而论,产在线经常可见要价数千万、甚至上亿的昂费机台,万一哪天突然失效停机,不仅可能酿成惨重的原物料报废损失,甚至让公司无法如期达交,恐为日后营运发展增添变量。
因此如何让业者透过实时监控、数据蒐集,结合后端分析应用,以期在设备发生非预期异状前,及早发出预警,好让业者有充裕时间进行应变,无疑是重大课题,于是带动人工智能(AI)、物联网(IoT)成为制造型企业群起簇拥之热门标的。赛仕电脑(SAS)业务支持部大中华区资深顾问卢延年说,尽管制造业界追求预防维护的立意甚佳,但就现阶段而论,不少工厂的执行状况并不如预期。
卢延年点出问题症结,企业普遍借重生产过程的数据,例如温度、压力、流量、电压、电流等等数值型数据做为预测基础,无奈准确度不见得高;换言之单靠这些素材,不足以协助企业摆脱设备非预期失效的危机。
如何提高预测精准度?企业须回归基本面,务实看待机台设备产生的数据,是否还有过去忽略的加值运用空间;企业不难发现,机器除了提供前述数值型数据,也会产出以文字及数字为基础的日志(Log)档案,而失效侦测与分类系统(FDC)仅采用数值型数据、不采纳Log,殊不知这些从未被善加利用的大量Log,着实埋藏着魔鬼细节,对于预知机台设备即将失效,有一定作用。
卢延年重申,Log属于文字型数据,个中蕴含一些以往未被人察觉的细微症万亿。他举例说,某企业用以监控生产设备的服务器,被赋予数据收集、实时监控的重任,其包含了AP Server、Database Server,及与前端机台整合的Server,并结合Watchdog第三方监控程序,其中任一环节出状况,恐导致厂区几百台生产设备顿失监控,重要性不言可喻;有天监控服务器发出异常告警,但此时已停止运转,代表已经构成伤害,用户大惊之余,要求设备商尽速检讨原因并提出改进建议。
从日志档挖掘细微症万亿,掌握设备失效前万亿
事实上,前述意外早在Log当中显现端倪;经Log显示,先前AP Server与Database Server的连线过程已有断断续续的异状,当时AP Server即曾执行Retry,只是未达缺省上限次数,故未启动中止运作的自我保护机制,如今则因Retry次数超标而停机;假使用户能及早运用SAS的串流分析技术,结合自然语言处理方式,持续对Log执行实时分析,早在数天或数小时前,就有机会力挽狂澜。
着眼于此,SAS以串流分析平台为基础,协助制造业解析文字型数据信息、建立模型,借此打造有效的早期预警机制;未来亦会将图像、影像等其他非结构数据一并纳入分析,据以发挥更大功效,例如半导体公司在HDP或CVD制程时,当腔体内离子气体反应有些微色泽异常反应,如发生微电弧效应时,便可透过影像识别结合串流分析,立即发出警讯。
卢延年指出,SAS平台全方位支持多重演算法与机器学习技术,可望藉由AI边缘运算完成串流分析,不仅协助制造业实现设备故障预警,亦可做为瑕疵分类、产品品质监测分析之用。例如经营轨道交通运输设备的大厂GE Transportation,便与SAS合作,善用连线火车头上内建的串流边缘分析能力,实时分析传感器数据,确保GE火车头恒常保持安全与高效率的运行状态。