當前位置:服務器技術專區 → 正文

服務器維護清單中的7個步驟

責任編輯:cres 作者:Stephen J. Bigelow |來源:企業網D1Net  2019-12-26 10:36:49 原創文章 企業網D1Net

為了有效地維護服務器,服務器管理員必須執行主動的硬件和軟件檢查。而服務器的維護清單必須包括除塵、日志查看、軟件補丁程序測試等。
 
即使具有服務器的性能和冗余功能,增加的工作負載整合和可靠性期望也會對服務器硬件造成損害。
 
服務器維護清單應涵蓋物理元素以及系統的軟件層配置。還必須考慮到以下事實:徹底維護需要的時間、人工時間和測試。使用清單有助于服務器管理員定義目標,并保持IT團隊的正常運轉。
 
1.制定維護程序
 
服務器管理員經常忽略計劃維護窗口。不要等到出現故障時才開始維護;要留出時間進行例行的服務器預防性維護。
 
維護頻率取決于服務器設備的使用年限、數據中心和需要維護的服務器數量。例如,與部署在高效微粒空氣過濾、冷卻良好的數據中心中的新服務器相比,位于設備柜中的老舊服務器需要更頻繁的檢查。
 
組織可以根據供應商或第三方提供商的例行程序制定例行維護計劃;如果供應商的服務合同每四個月或六個月要求進行系統檢查,需要遵循這個時間表。
 
2.為準備停機做好準備
 
解決服務器維護清單上的項目之前,首先需要制定計劃。這包括檢查系統日志中是否有需要更加直接關注的錯誤或事件。如果系統日志表明特定內存模塊有錯誤,則應訂購替換的雙列直插式內存(DIMM)并將其安裝。同樣,如果有可用的固件、操作系統或代理補丁/更新,請在計劃的維護窗口之前先進行測試和審查。
 
制定明確的計劃以使系統脫機并使其恢復服務。在進行虛擬化之前,服務器及其駐留的應用程序將需要停機才能容納維護窗口,但這迫使服務器管理員在晚上或周末實施維護。
 
虛擬服務器支持遷移工作負載而不是停機,因此服務器管理員可以將應用程序遷移到其他服務器,并且只要在底層主機系統上進行服務器維護,它們就將保持可用狀態。在維修之前,需要首先了解虛擬機的去向,將虛擬機遷移到選定的系統,并在關閉服務器進行維護之前驗證每個工作負載是否正常運行。
 
此時,服務器管理員可以關閉服務器并將其從機架中移除。
 
3.檢查氣流路徑
 
在服務器宕機之后,需要目視檢查其外部和內部氣流路徑。清除所有可能阻礙冷卻空氣的積塵和碎屑。
 
從外部空氣入口和出口開始,然后進入系統機箱,查看CPU散熱器和風扇部件、內存,以及所有冷卻風扇葉片和風道。從機架上卸下服務器之后,需要確保服務器清潔。采用干凈、干燥的壓縮空氣清除防靜電工作區上的灰塵或碎屑。
 
除塵并不是一個新的過程,但仍然是必要的。灰塵是一種絕熱材料,因此去除灰塵尤為重要,因為替代的冷卻方案和美國供暖、制冷和空調工程師學會 (ASHRAE)的建議已提高了數據中心的工作溫度。灰塵和其他氣流障礙會導致服務器消耗更多的能量,甚至可能導致組件故障。
 
4.檢查本地硬盤
 
服務器依靠內部硬盤進行引導、工作負載啟動和存儲以及用戶數據。磁盤介質問題損害了工作負載的性能和穩定性,并導致硬盤過早故障。使用“檢查硬盤”實用程序之類的工具來驗證硬盤的完整性,并嘗試恢復硬盤上的任何壞的扇區。
 
采用磁性媒質的硬盤并不完美。其常見的問題包括損壞扇區和碎片化。在發生存儲錯誤后,RAID在保持數據完整性方面有很大的進步,但體積較小的1U機架服務器無法提供足夠的物理空間來部署硬盤陣列。
 
只要NT文件系統和文件分配表硬盤文件碎片不會消失,只要文件系統使用第一個可用集群的硬盤空間即可。碎片會減慢服務器硬盤的速度并導致故障。Optimize-Volume實用程序Windows Server 2016對存儲層進行碎片整理和處理。
 
5.驗證日志數據和事件
 
服務器在事件日志中記錄了大量的事件信息。沒有仔細檢查系統、惡意軟件和其他事件日志,沒有服務器維護清單是不完整的。當然,關鍵的系統問題應立即引起管理人員和技術人員的注意,但無數小問題可能預示著長期的問題。
 
在檢查日志時,管理員應檢查報告設置并驗證正確的警報和警報接收者。例如在檢查日志時,管理員應檢查報告設置,并驗證正確的警報和警報接收者。例如,如果技術人員離開服務器組,則需要更新服務器的報告系統。
 
還要仔細檢查聯系方式。如果錯誤發生在工作時間之外,則向技術人員所在公司的電子郵件地址提供發生錯誤的報告將是無效的。
 
當日志檢查發現長期或重復出現的問題時,主動調查可以在問題升級之前解決問題。如果服務器的日志報告內存中的可恢復錯誤,它將不會觸發嚴重警報。但是,如果有重復的情況表明模塊出現問題,則管理員可以執行更詳細的分析,以識別即將發生的故障。
 
如果問題不夠嚴重,不會關閉服務器,管理員可以將服務器恢復到生產狀態,直到出現替換硬件。
 
6.測試補丁和更新
 
服務器的軟件棧(BIOS、操作系統、管理程序、驅動程序和應用程序)必須協同工作。不幸的是,軟件代碼很少是沒有問題的,所以這一難題的部分經常被修補或更新,以修復錯誤、提高安全性、簡化互操作性,以及提高性能。
 
任何軟件都不應具有自動更新。管理員應確定是否需要修補程序或升級,然后徹底評估和測試更改。
 
軟件開發人員可能無法測試每種可能的硬件和軟件組合,因此需要明智地選擇補丁和更新,以避免性能問題或工作流程中斷。例如,監視代理程序補丁可能會導致重要的工作負載問題,因為新代理程序占用的帶寬比預期的要多。
 
向DevOps的遷移具有較小且更頻繁的更新,這增加了出現問題的可能性。組織仍必須在實驗室中測試任何修補程序或更新,然后才能將其部署到沙盒或測試安裝程序中,并且始終具有還原原始軟件配置的能力。
 
7.記錄所有系統更改
 
在維護時段內,服務器可能會發生很多事情,例如硬件、軟件或系統配置更改。服務器管理員完成服務器維護清單后,對他們進行仔細檢查并記錄所有新系統狀態至關重要。例如,更改網絡適配器、添加或更換內存或更新操作系統會更改系統的配置。
 
依賴系統配置管理工具的組織可能需要更新或發現任何更改,在允許系統重新投入使用之前,將這些更改記錄到配置管理數據庫中。服務器管理員必須更新任何強制的或所需的狀態配置狀態,以允許進行更改。
 
還要驗證系統的安全狀態,例如防火墻設置、反惡意軟件版本或掃描頻率和入侵檢測設置。安全檢查確保系統軟件的更改不會無意間暴露出在先前配置中關閉的所有攻擊面。
 
服務器重新聯機后,不要忘記更新任何系統備份或災難恢復(DR)內容。
 
驗證服務器的備份/災難恢復頻率保持不變,除非必須特別調整任何相關設置以反映服務器的新用例。
 
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

關鍵字:服務器

原創文章 企業網D1Net

服務器維護清單中的7個步驟 掃一掃
分享本文到朋友圈

關于我們聯系我們版權聲明友情鏈接廣告服務會員服務投稿中心招賢納士

企業網版權所有©2010-2020 京ICP備09108050號-6

^
北京 呼和浩特 7星彩 壹点顺配资 锦鲤配资 云南时时彩 老虎配资 每日一股 怎么看股票涨跌几个点 三分彩 内蒙古快三 6场半全场 陕西快乐十分 股票涨跌的依据 黑龙江十一选五 七乐彩 湖南快乐10分 润旺配资