天天看点

台北桃园机场计算机为何会当机36小时?!

 根据相关媒体报导,问题起因于第二航站的境管计算机的磁盘阵列系统中有三块硬盘和一片主板在本月3日发生故障,标得移民署计算机维护案的神通计算机于本周一(5日)清晨更换其中一块硬盘,并至第一航站仍正常运作的境管计算机中,抓取与汇入入出境数据的时候,因不明原因导致互为备份的第一航站与第二航站的境管计算机先后当机,计算机当机后,除高雄港与高雄小港机场以外的机场港口皆受影响,全得以人工操作的方式检核入出境旅客数据,历经36小时抢修后,境管计算机已恢复大部分的入出境检核作业。

    姑且先不谈有无列管人士趁乱(境管计算机当机36小时)离境,但该事件确实透露出桃园机场在信息管理上的一些疏失。

    第一,境管计算机的备份机制不够完善。事发之际,我曾去电桃园机场信息室询问导致入出境计算机当机的真实原因是人为疏失、黑客入侵或机器损害,以及桃园机场有没有为入出境计算机架设异地备份机制,无奈,无论我用尽各种方式(包括变声、换个方式问问题等),对方不是拒答就是给我软钉子。

    但就我动笔撰写该篇文章前所搜集到的一手与二手资料来看,移民署对于用来管理记载1981年以后约40亿笔入出境旅客数据的境管计算机的备份管理机制似乎不大严谨。理由是,早在本次事件发生前,境管计算机即曾因为系统过于老旧而出现多次当机事件,但因维修人员都能在十几分钟内抢修完毕,导致主事者从未正视国境大门会因境管计算机过于老旧不易维修而洞开36小时等窘境发生、更不用说台湾国际机场的专业形象很可能毁于老旧的境管计算机系统。

    再者,某不愿具名的业界人士表示,由于第一航站与第二航站的境管计算机系统极老旧,即便移民署曾有打算在异地为境管计算机系统重建备份机制,但在考虑技术门坎过高、得投入庞大资金与资源等因素后,便将该计划往后延宕,因此,当境管计算机因不明原因先后当机后,移民署除忙抢修,以及改以人工操作取代计算机作业外,别无他法。

    信息服务管理机制不够严谨

    我想,经过这次的风波,移民署与桃园机场等主事单位应该会更谨慎的重新规范信息服务作业模式。

    第二,信息服务管理机制不够严谨。促发桃园机场境管计算机系统当机的主要原因众说纷纭,不过,无论真实原因是硬件损毁或者是人为疏失,都建议移民署重新检讨与拟定更严谨与完善的信息服务管理(it service management;itsm)机制,尤其,桃园机场里的软硬件信息系统架构皆极庞大且复杂,为确保相关人员能在异常状况发生前、或者是问题发生后,以最短的时间内找出问题症结点、解决问题,相关人员是否有一份最新、最详细的机场信息服务标准作业程序供参考,极重要。

    从这次的境管计算机当机长达36小时一事来看,桃园机场手头似乎没有最新且实时的信息服务标准作业程序供参考。否则,移民署国际事务大队与信息室等主事单应该能在第一时间对外说明导致境管计算机当机的症结点为何、境管计算机不会在移民署对外表示6小时即可完修却拖至36小时后才恢复正常运作,当然,标得移民署2009年计算机维修案的神通计算机也不应该会对媒体表示,欢迎去年得标公司─大同世界科技一起加入抢修等。

    让我们在换一个角度思考,即使移民署有与签约厂商签定系统故障后6小时即得修复的服务层级协议(sla)、签约厂商也向移民署提出可证明其专业服务能力的证照,如政府标案必备证照一cmmi等,但若移民署本身没有一套完善的信息服务管理机制,那么,如何稽核外部厂商的服务能力确实符合移民署预期?位居第一线的移民署信息人员是否能在最短时间解决厂商也无力解决的问题?如何确保桃园机场的关键信息系统可以7 x 24的正常维运?

    事实上,除无完善的异地备份机制,以及欠缺严谨的信息服务管理机制外,该事件亦突显出移民署在风险管理与危机处理等构面的能力待改善,不过,鉴于事发至今才第三天,再加上内政部长廖了以也向媒体保证在调查出确切原因后会给大家一个交代,因此,本文仅探讨该事件可能涉及的信息管理问题等议题,至于后续议题,例如境管计算机当机后所可能引发的信息安全危机等,欢迎大家一起讨论。

作者:zdnet台北记者蔡宜秀

来源:51cto