作為一個集中存儲,處理,傳輸,交換,管理數據信息的關鍵性物理空間,隨著互聯網時代的深化和企業信息化網絡的全面搭建,數據中心正進入下一個飛速發展的黃金時代。在迎來市場需求激增的同時,也面臨著越來越復雜的運維管理所帶來的重重挑戰。目標在前,思路先行,共濟監控管理解決方案專家史俊為您解讀未來數據中心監控管理的五大趨勢,讓我們共同探索未來之路,讓數據中心的管理更簡單!
史駿 | 共濟技術顧問,運維專家
01數據是核心 ?
數據是數據中心管理的基礎,數據的完整性、準確性、顆粒度都會影響管理的有效性。數據也是數據中心從“成本中心”向“利潤中心”演進的動力源泉。因此監控管理系統的建設中,數據是重中之重。
1、數據的完整性要求:數據中心管理所需的數據包括:性能、資產、人員、業務、財務等。系統應當具備數據采集全覆蓋的能力,具備自采集和子系統整合能力,而非僅僅關注上層業務功能。
2、數據的準確性要求:在數據采集和整合的過程中,應對各類型的數據做統一的報文格式、告警定級、聯動策略的規范化設計,確保所有數據都說同一種的“語言”,提高數據的治理和應用效率。通過業務流程及服務,定期對數據進行校準,確保數據的置信度滿足管理要求。
沒有完整準確的數據支持,任何的智能化、AI應用都是空中樓閣。
02 場景化
監控管理系統的建設需要緊扣用戶的實際應用場景,而非簡單的功能設計。充分考慮數據中心運維管理工作的共性和不同行業的個性,參考管理規范的要求和現場使用者的特點來搭建屬于用戶的管理工作體系,并用合適的交互界面落地實現。
監控管理系統需要與企業內部的其他管理系統整合,如ITSM,以實現諸如變更、事件等管理流程“雙閉環”,通過“雙閉環”邏輯,打通各組織和部門之間的信息流和業務流,實現各種業務場景在"業務"和"實務"兩個層面進行有機的整合,相互聯動,雙向核準,提高工作效率,還能從宏觀角度掌握整個業務流程的處理情況和績效數據,為優化服務水平、提升服務能力奠定堅實的基礎。
03 “兩端、兩邊+一平臺”
不同于互聯網應用“極端”關注用戶體驗的需求,數據中心的監控管理系統需要兼顧兩個“端”,即用戶端和感知端,通過感知端采集完整準確的數據,通過用戶端為各維度的用戶提供業務應用;為了保證兩個“端”的有效服務,需要構建兩個“邊緣“,一是靠近感知端的邊緣計算,事件聯動,實現快速事件響應;二是靠近用戶端的邊緣發布,全局性冗余,保障用戶的應用感受和服務響應能力。平臺側則是數據+業務能力群集,并整合各類支撐業務的專業子系統。
04 精細化
精細化管理是一種理念;源于發達國家的一種企業管理理念,它是社會分工的精細化以及服務質量的精細化對現代管理的必然要求,是建立在常規管理的基礎上,并將常規管理引向深入的基本思想和管理模式,是一種以最大限度地減少管理所占用的資源和降低管理成本為主要目標的管理方式。而影射在數據中心監控管理系統的設計上可分解為兩個層面:
1、細化管理顆粒度:數據中心管理的顆粒度需要逐步的深化、細化,將原有基于機房一級的管理顆粒度向模塊、機柜、設備、板卡、端口等級別層層深入,將蜷縮在高維度的海量信息降維展現出來;管理人員可以通過系統從各個維度(人、事、物、時間、空間)掌握數據中心的每一項信息,并可以從每一個細節入手,發掘數據中心的潛力和問題。
2、通過標準規范減少管理成本:所有的服務將是標準化的流程,并在系統上建立統一的服務目錄,所有來自于內部或外部的服務請求均有與之相對應的自動化流程驅動流轉;所有的流程和節點都應經過反復的推敲和實踐,盡可能的減少無效操作和誤差,充分發揮標準化帶來的整體效益。
05 智能化
數據中心智能化管理已經是當前數據中心運營管理的熱門話題,通過智能化運營可以最大程度的優化管理結構和流程,節省運營成本,提高數據中心可持續運行的穩定性,優化運行方案,實現節能環保的政策性要求。
在夯實數據地基,貫通業務邏輯的基礎上,數據中心智能化監控管理可以有幾個方面發展:
1、告警的智能化關聯和根本原因分析(RCA):即系統收到多個告警時,分析其根本原因(或主要告警的真實來源)和受影響的范圍,并根據策略自動關聯發起事件流程及通過必要的手段提醒相應的人員。
2、分析歷史資料(包括告警信息、維修信息、運行信息等),從中發現潛在的隱患,并通過必要的手段提醒相關人員執行預防性維護流程(Predictive Maintenance Program,PdM),來消除或減輕風險的發生機率和影響程度。
3、智能搜索和關聯事件相關的經驗教訓、SOP、EOP等,為管理員執行事件處理時提供有效的知識支持。
4、有自學習能力,自動通過對收集到的數據中心運行數據進行學習建模,結合專家系統轉化為:1、數據中心運行環境參數模板,用于判斷和偵測運行異常狀態;2、通過智能控制,實現在滿足邊界條件的基礎上,最優化設施運行方案。