隨著學校信息化建設近年來的快速發展,網絡用戶數量不斷增長,互聯網應用越來越豐富。當前,學校已經建成了覆蓋全校的網絡系統,包括有線/無線網絡、數據中心網絡、出口網絡、安全系統等,服務于全校師生的網絡接入、校園各類應用系統、公眾教育等需求。
校園網網絡和應用的規模爆發性增長,而運維人員的數量、成本都沒有成比例增加,這使得運維人力資源的壓力越來越大,如何用更少的運維人員,維護更大規模的網絡,成為管理人員一直思考的問題。傳統的運維管理,依托于網管系統、流量分析系統等,更多的是對于網絡設備的管理和網絡基礎性能的管理,網絡應用一旦出現故障很難定位。管理人員無法全面地洞察網絡,在進行網絡擴容時沒有有效的網絡擴容、網絡規劃的決策依據。
為了解決上述問題,我們建設了基于分布式主動撥測探針的網絡性能監測系統,針對校園網應用特點,利用主動撥測探針,進行7×24小時不間斷的自動化網絡運維巡檢,對各項網絡及應用運行狀況的監測和告警。使用多維度多視角端到端的網絡性能監測,涵蓋網絡各項指標,實現多維度多視角端到端的網絡監控。實際應用表明,該系統能便捷地采集各項網絡數據,并進行智能對比分析,多維度數據挖掘,有效監測用戶網絡體驗情況,為實時發現網絡故障和準確處理故障提供支撐,提高了網絡管理水平。
現狀分析
為了滿足用戶日益增長的對網絡體驗的要求,我們對網絡管理的現狀進行分析,發現現有網絡管理存在以下不足。
一是缺少針對校園網特點的業務質量監測技術手段。
校園網作為學校重要的信息化基礎設施,不僅需要滿足教職員工和學生的日常網絡需求,還需及時解決各種網絡故障和安全事件。由于校園網所承載的業務呈現多樣性、流量突發性,原有的技術手段難以對應用對象做到主動探測,例如時延、丟包率、網絡帶寬等網絡運行狀態以及業務運行質量。另外,現有校園網采用被動式運維和管理模式,造成管理能力有限、運行質量無保障、業務質量難以衡量、業務可靠性下降等問題。現有監控指標體系側重于網絡性能指標監控,無法反映網絡業務的實時、真實的情況,單靠網絡性能指標無法準確反映用戶的真實感知。
二是缺乏面向校園網故障的快速主動定位能力。
校園網網絡故障覆蓋范圍大,涉及面廣,定位方向多,涉及網絡鏈路、網絡帶寬、設備性能、準入認證、軟件程序等,且故障具體現象不一,導致了潛在的故障難以快速定位。現有指標監控體系不完善,不能快速發現業務質量故障和性能劣化情況,不能根據指標波動對業務質量進行預警。由于網絡故障可能涉及到多個方面和多種潛在故障,因此網絡運維人員需要具備相應的專業知識和技能,才能夠根據故障的具體表現和可能的原因進行定位和處理。網絡運維管理人員水平以及用戶推測等人為因素都會導致故障定位的精準度出現偏差。傳統網絡運維管理人員主要依靠設備主動上報告警或故障來獲悉相關管理信息,即使發現故障,也很難給維修人員快速修復的精確位置。如何降低維護人員工作量、縮短故障歷時,成為校園網網絡管理的一個難題。
三是缺少適合校園網運行質量的自動化監測管理工具。
校園網網絡運維管理工具過度分散,已經成為影響學校提高網絡管理效率的重要阻礙,現在還沒有有效的工具,保障集中、高效、實用的綜合監控數據通信網的基礎設施正常、可靠地運行。校園網管理人員缺少針對校園網基礎網絡和應用運行狀態的綜合監控、測量和管理手段。管理人員急需有效工具定期提供網絡服務質量報告,清楚地知道網絡質量的好壞,以免因為主觀因素遭到用戶投訴,從管理角度分析了解給用戶提供的網絡服務質量的情況,了解用戶的感知。
從以上的網絡管理的現狀進行分析表明,針對校園網網絡應用特點,研究并引入基于分布式主動撥測探針的網絡性能監測系統,在現有的網絡管理體系中非常有必要。我們需要建設一個網絡質量監測平臺,7×24小時不間斷收集各項測試結果,呈現各項感知數據,通過報表、告警、質量分析來展示,定位網絡故障。使用更加智能化的網絡管理和監測技術,建立完善的業務質量指標體系,實現對校園網網絡運行質量和業務質量的主動監測和優化管理。