引言
資料中心營運是一項複雜的系統性工作,涉及各類專業多達十餘種。漫長的營運周期,賦予了一線營運人員專業專注、精益求精的工匠特質。每一次巡檢、每一次維護、每一次變更的背後,都離不開對方案細節、操作步驟、營運影響的全方位考量,而工匠精神正是在這些微小的細節中孕育和萌發。日複一日紛繁複雜的營運維護,不僅磨砺了一線營運人員精深的功底,更是激勵和引導着他們立足一線、不斷優化創新。
在多年的經驗積累和技術沉澱過程中,騰訊資料中心營運人員正在不斷推動一線營運的革新。從資料中心架構設計創新,到設施裝置、輔助工具優化改良,目前已經累計申請資料中心相關專利60餘件,獲得專利授權近40件。“以匠心持續深耕專業技術,以創新不斷打磨營運能力”,正在成為騰訊資料中心對“工匠型創新”精神的探索與追求。
本文将選取近三年來騰訊資料中心已經落地專利中的4項作為分享主題,希望以此為契機抛磚引玉,引起行業對一線營運優化創新的關注和重視;期待行業内出現更多的“匠士”,共同推動資料中心營運能力邁上新的台階。
壹
一種伺服器輔助上架裝置
随着伺服器性能、硬體配置的不斷提升,其重量也越來越大。以往普通伺服器重量約20~30kg/台,而新型的高性能伺服器已經提升至40~70kg/台。重量的成倍增加,給裝置上架以及後期運維帶來了極大的挑戰;如果繼續采用單純的人工上架方式,不僅将占用更多的人力,而且存在裝置跌落傷人的風險。随着騰訊資料中心營運的伺服器超過百萬大關,伺服器上下架這一看似不起眼的工作場景,卻已經成為了一線營運人員無法忽視的問題。
在此背景下,我們設計了一款伺服器輔助上架裝置,營運人員可将單台重量達50kg的伺服器放置在承重台上,通過控制屏設定升降高度,由電機驅動傳動機構,實作對伺服器的升降,精度可達毫米級。當伺服器到達指定高度後,由營運人員輕輕推送伺服器進入機位即可。此外,該上架裝置還設計包含:刹車限位、升降自鎖與減速保護、人員輔助踏步、斷電自鎖保護等實用功能。該輔助上架裝置已經申請發明專利,完成打樣制造,并應用到機房營運中,在提升營運人員工作效率的同時,也進一步保障了人員和裝置營運安全。
目前行業内從事伺服器升降裝置生産的公司稀少,其中ServerLift作為知名度較高的品牌,主要在海外售賣,而且價格較高。由騰訊資料中心研制、廠商共同生産的伺服器輔助上架裝置,其成本約為ServerLift同等産品的30%(随着裝置量産,價格優勢将更加突出)。此外,随着單台IT裝置重量的進一步增加,我們已經開始着手研制液壓式上架裝置,有望達到200kg的承重目标,并能夠适應不同機房環境的使用要求。
貳
一種易維護式電池櫃
電池櫃、電池架作為存放蓄電池的結構體,通常并不為人所關注。往往真正出現蓄電池相關的問題時,才發現這些問題的背後與電池櫃的設計有着千絲萬縷的關系。基于過往的營運實踐和故障案例,我們發現蓄電池更換困難和蓄電池漏液風險這兩個問題值得深入研究和探讨。于是,一款可以解決上述兩個問題的易維護式電池櫃應運而生。
蓄電池更換困難
通常單節蓄電池重量可達70kg,應用于子產品化資料中心的電池櫃通常配置5~6層,每層可放置4節電池。當蓄電池出現故障或到達使用壽命時,蓄電池的更換将極為困難,其中還隐藏着巨大的人身安全風險。通過設計抽拉式電池托盤,可從電池櫃前後兩側抽拉;單方向層闆具備200kg承重能力,帶限位和鎖定保護,可以完全承載2節蓄電池。同時,通過配合液壓支撐小車,可以實作水準、豎直方向上的移動。
蓄電池漏液風險
蓄電池在長期運作過程中,一旦出現漏液,将極易腐蝕金屬支架,嚴重時可能造成接地短路故障。為了解決漏液帶來的風險,我們在接液盤中設計了支撐斜面,讓漏液可以快速彙集到漏液孔。同時,設計引流管,将各層漏液孔通過軟管統一彙集至底端接液盒中,實作對漏液的安全、快速排出。日常巡檢時,也可将底端的接液盒抽取出來進行檢查。
叁
一種便于巡檢的智能PDU
PDU作為末端電源的集中配置設定裝置,直接向伺服器、交換機等裝置提供電力,是資料中心應用數量最多的裝置之一。在長期運作過程中,PDU内部的接線端子可能出現松脫、老化等現象,導緻線纜發熱、損毀,進而引起PDU故障、機架掉電等。通過調研發現,現有的PDU設計通常難以發現上述營運隐患。
為了規避上述隐患,我們設計了一款帶有可開關式透明蓋的PDU,并配置溫度檢測子產品。日常營運過程中,營運人員可在巡檢時目視檢查接線端子外觀,也可以打開透明蓋,使用點溫槍/紅外熱成像儀進行溫度掃描;而溫度檢測子產品更進一步實作了對PDU運作的線上監測。
肆
一種新型儲油罐結構設計
柴油發電機組作為資料中心後備供電系統,在市電中斷或異常時,需要能夠快速投入并持續穩定工作,這背後也離不開供油系統的高可靠性。但在柴油發電機組實際運作過程中,我們發現由于柴油品質不一、柴油自身氧化、沉澱等因素帶來的影響,将在儲油罐底部形成雜質沉澱,導緻油罐從頂部到底部的柴油品質逐漸下降。而儲油罐在補充或抽取柴油過程中,由于油泵壓力較大,容易将儲油罐底部雜質和積水沖起,緻使油罐頂部柴油品質下降。一旦雜質較多的柴油進入柴油發電機組,将導緻柴油發電機組輸出電壓不穩定,嚴重時甚至可能導緻柴油發電機組無法正常運作。此外,儲油罐屬于密閉空間,檢修較為困難,底部雜質和積水難以有效排出。
是以,我們設計傘狀的減壓分流結構,用于減小柴油補充過程中對油罐底部沉積雜質的沖擊;同時将出油口位置設計為弧形面,優先抽取上層柴油;并通過配置過濾閥,進一步過濾雜質。此外,為便于定期檢查油品品質,設計獨立的清油管道,確定有效排出儲油罐底部雜質和積水。
結語
“天下大事,必作于細”。
就令螢火一般,也可以在黑暗裡發一點光,不必等候炬火。此後如竟沒有炬火,我們便是唯一的光。以上真的是魯迅說的。
随着騰訊資料中心規模、體量的不斷增加,堅守在一線的營運匠士正在經曆着越來越多的新場景、新挑戰。在未來,我們将繼續秉持“工匠型創新”精神,通過不斷細化營運思路;結合現場實際不斷創新、改良已有産品技術,優化流程方法;用沉澱後的經驗和技術,持續探索和實踐,為資料中心的發展帶去新的活力,也為資料中心營運創造更加廣闊的想象空間。