1.3.1計算機可靠性
1.計算機可靠性概述
計算機系統的硬體故障通常是由元器件的失效引起的。對元器件進行壽命試驗并根據實際 資料統計得知,元器件的可靠性可分成三個階段,開始階段器件工作處于不穩定期,失效率較 高;第二階段器件進入正常工作期,失效率最低,基本保持常數;第三階段元器件開始老化, 失效率又重新提高。這就是所謂的“浴盆曲線”.是以,應保證在計算機中使用的元器件處于 第二階段。在第一階段應對元器件進行老化篩選,而到了第三個階段,則淘汰該計箅機。
通常用平均修複時間(MTRF)來表示計算機的可維修性,即計算機的維修效率,指從故障發生到機器修複平均所需要的時間。計算機的可用性是指計算機的使用效率,它以系統在執行任務的任意時刻能正常工作的機率A來表示,即
計算機的RAS技術就是指用可靠性R、可用性d和可維修性S三個名額衡量一個計算機 系統。但在實際應用中,引起計算機故障的原因除了元器件以外還與組裝工藝、邏輯設計等因 素有關。是以,不同廠家生産的相容機,即使釆用相同的元器件,其可取性及MTBF也可能會 相差很大。
2.計算機可靠性模型
計算機系統是一個複雜的系統,而且影響其可靠性的因素也非常繁複,很難直接對其進行 可靠性分析。但通過建立适當的數學模型,把大系統分割成若幹子系統,可以簡化其分析過程。 常見的系統可靠性數學模型有以下三種。
(1)串聯系統。假設一個系統由#個子系統組成,當且僅當所有的子系統都能正常工作時, 系統才能正常工作,這種系統稱為串聯系統,如圖1-16所示。
編輯推薦: