系统管理员的工作描述不仅包括服务器和网络的监控基础设施,而且还包括物理设施的方面。在这方面缺乏监测,可能会导致浪费电力资源,出现热点,甚至更糟的是停电或遭到火灾。
采用监控应用程序是防止数据中心灾难的一种实用方法,但对于数据中心管理团队而言,能够全天候排除故障,并在凌晨2点以及等到第二天处理非关键问题,这二者之间有一个细微的界限。
移动应用程序是一个有用的工具,以便了解潜在的数据中心设施问题,并可以让系统管理员在任何时候无论是在工作设备还是在家里的设备上接收警报,。
forrester research公司基础设施和运营分析师索菲亚 巴尔加斯表示:“在管理层中,我看到已被用于系统健康监控和实时警报管理的应用程序...尤其是在非工作时间。”
例如,来自施耐德电气的一种新数字服务struxureon提供了适用于ios和android的移动应用程序,可以实时查看关键数据中心指标,如服务器性能和温度。为了检测和解决数据中心中的问题,管理员可以使用更多的功能,例如移动it通知和事件跟踪。要获取应用程序,组织需要将struxureongateway下载到运行windows64位操作系统的专用服务器上。
对于规模较小的设施和边缘数据中心,艾默生网络能源公司发布了icomcms,这是一个适用于规模较小的设施环境热管理的应用程序。例如,边缘数据中心往往有独特的冷却的挑战,并且有着可靠性和物理建筑的限制,以及有限的冷却能力。这使得远程数据中心设施管理显得尤为重要。
synapsense是一款专为iphone和android设计的应用程序,可以让管理员直接访问环境信息来解决冷却问题。管理员可以管理到机架级别的问题,并使用实时成像来识别数据中心中的热点。
虽然大多数it团队希望针对关键问题可以立即收到警报,但是对于那些没有收到警报的人来说,可能会感到很失望。管理员可以使用synap sense应用程序,以及施耐德电气的全天候远程监控服务软件struxureon,。如果数据中心团队中没有确定哪位工作人员采用这个应用程序值班,那么在有问题时,这个软件将会呼叫用户可用性列表中列出的第一个人。而管理员可以设置警报阈值,以确保他们只接收it和关键事件的通知和电话。
管理员使用icomcms,还可以指定报警故障排除任务和管理报警工作流程。
本文作者:佚名
来源:51cto