1.服務器程序維護
服務器管理員經(jīng)常忽略計劃維護窗口。不要等到出現(xiàn)故障時才開始維護,要留出時間進行例行的服務器預防性維護。
維護頻率取決于服務器設備的使用年限、數(shù)據(jù)中心和需要維護的服務器數(shù)量。例如,與部署在高效微?諝膺^濾、冷卻良好的數(shù)據(jù)中心中的新服務器相比,位于設備柜中的老舊服務器需要更頻繁的檢查。
2.檢查氣流路徑
在服務器宕機之后,需要目視檢查其外部和內(nèi)部氣流路徑。清除所有可能阻礙冷卻空氣的積塵和碎屑。
從外部空氣入口和出口開始,然后進入系統(tǒng)機箱,查看CPU散熱器和風扇部件、內(nèi)存,以及所有冷卻風扇葉片和風道。從機架上卸下服務器之后,需要確保服務器清潔。采用干凈、干燥的壓縮空氣清除防靜電工作區(qū)上的灰塵或碎屑。
3.服務器硬盤維護
服務器依靠內(nèi)部硬盤進行引導、工作負載啟動和存儲以及用戶數(shù)據(jù)。磁盤介質(zhì)問題損害了工作負載的性能和穩(wěn)定性,并導致硬盤過早故障。使用“檢查硬盤”實用程序之類的工具來驗證硬盤的完整性,并嘗試恢復硬盤上的任何壞的扇區(qū)。
4.補丁更新
任何軟件都不應具有自動更新。管理員應確定是否需要修補程序或升級,然后徹底評估和測試更改。
軟件開發(fā)人員可能無法測試每種可能的硬件和軟件組合,因此需要明智地選擇補丁和更新,以避免性能問題或工作流程中斷。例如,監(jiān)視代理程序補丁可能會導致重要的工作負載問題,因為新代理程序占用的帶寬比預期的要多。