隨著網(wǎng)絡(luò)規(guī)模的擴大,集約化的推行,網(wǎng)絡(luò)中產(chǎn)生海量告警,大量無效工單影響運維效率。在此背景下,各運營商提出告警壓降的目標(biāo),希望通過告警相關(guān)性分析減少工單數(shù)量,大幅降低無效告警,提升故障處理效率、降低運營成本。國內(nèi)三大運營商以及多個國際主流運營商均對此功能有著非常迫切的需求。
基于此背景,烽火通信成立技術(shù)攻關(guān)項目,率先實現(xiàn)了OTN設(shè)備告警相關(guān)性分析功能。烽火人工智能團(tuán)隊成功研發(fā)了一款智能告警處理引擎,該引擎旨在解決網(wǎng)絡(luò)故障診斷這個OSS領(lǐng)域的老難題,應(yīng)用大數(shù)據(jù)分析技術(shù)和機器學(xué)習(xí)算法,在告警關(guān)聯(lián)分析和根衍推理方面取得了重要突破。
圖一 烽火告警相關(guān)性分析系統(tǒng)系統(tǒng)圖
烽火智能告警處理引擎由學(xué)習(xí)引擎和執(zhí)行引擎兩部分組成,學(xué)習(xí)引擎通過對多現(xiàn)場的歷史告警進(jìn)行迭代訓(xùn)練和學(xué)習(xí),歸納出告警關(guān)聯(lián)規(guī)則,并運用領(lǐng)域知識或?qū)<抑R對規(guī)則進(jìn)行提煉與驗證,形成有效的告警規(guī)則庫。執(zhí)行引擎利用告警規(guī)則庫,對網(wǎng)絡(luò)告警進(jìn)行實時的根因分析,識別出根告警,過濾掉由此衍生的告警。
圖二 烽火告警相關(guān)性分析系統(tǒng)組成
目前,該引擎在OTN網(wǎng)絡(luò)的告警處理上取得了令人滿意的效果,通過實驗室驗證和現(xiàn)場數(shù)據(jù)測試,準(zhǔn)確率指標(biāo)超過90%,告警壓縮率峰值高達(dá)50%。后續(xù)將進(jìn)一步拓展到無線(4G/5G)、核心網(wǎng)、接入網(wǎng)等領(lǐng)域使用,為運營商運維部門和設(shè)備廠商的工程維護(hù)人員提供強有力的故障診斷工具,提高網(wǎng)絡(luò)故障的處理效率。 目前該解決方案已經(jīng)在全國多個省份的不同運營商完成試點,均取得了理想效果。以杭州移動為例,杭州覆蓋到的45條規(guī)則經(jīng)驗證正確率為100%,可滿足杭州移動現(xiàn)網(wǎng)的使用場景。
烽火智能告警處理解決方案的成功推出,大大提高了運營商網(wǎng)絡(luò)運維階段的工作效率,也標(biāo)志著烽火在網(wǎng)絡(luò)運維方面人工智能化進(jìn)一步深化布局,全力推進(jìn)!