從無到有,政務系統(tǒng)的全面可觀測模板
隨著我國信息化建設的不斷深化,政府和企事業(yè)單位對于信息化建設的投入逐年增加,網絡系統(tǒng)日益復雜化,運行在網絡系統(tǒng)上的各種業(yè)務系統(tǒng)也越來越多,對IT系統(tǒng)的依賴程度也越來越深。不確定的業(yè)務環(huán)境、不斷變化的工作性質和數字業(yè)務技術的加速發(fā)展正在加速政府數字化轉型建設。因此,如何對 IT 系統(tǒng)進行有效管理和維護直接關系到用戶的日常工作和業(yè)務開展能否穩(wěn)定、可靠、有序的進行。
此外,在微服務架構的演進下,政府IT資源涉及多部門、多廠商、多平臺,運維難度大、效率低且手段傳統(tǒng),導致故障發(fā)現(xiàn)不及時、系統(tǒng)運行不穩(wěn)定,加之業(yè)務調用鏈越來越長,涉及多系統(tǒng)之間調用,出現(xiàn)問題的時候很難精準定位問題點。
政務系統(tǒng)承擔著行政審批、費稅征繳等政府核心業(yè)務,系統(tǒng)響應速度慢、宕機等問題勢必會影響到人民群眾的切身利益,如何提高系統(tǒng)響應速度、提升系統(tǒng)穩(wěn)定性成為政務系統(tǒng)運維工作的關鍵。
政務系統(tǒng)的IT 運維難題
近幾年,隨著系統(tǒng)架構的不斷升級,特別是微服務架構下上線投產后,一旦出現(xiàn)故障,缺乏完整的標準作業(yè)流程,難以有條不紊的針對問題進行排查、定位和有效解決,對于政務系統(tǒng)而言,其在運維工作中主要存在兩方面的問題:
其一,對于政務系統(tǒng)而言,其IT 運維建設還不完善,應用架構梳理嚴重依賴人力與個人經驗,當遇到問題,往往需要通過人工梳理應用調用關系,且每次功能迭代后需要人工重新梳理,需要消耗大量時間完成;在微服務架構下,業(yè)務調用鏈越來越長,涉及節(jié)點數量越來越多,應用性能問題也成為影響用戶體驗的核心因素之一。
其二,業(yè)務關聯(lián)關系復雜,且出現(xiàn)故障時缺乏完善的故障診斷流程,各部門之間缺乏有效的協(xié)同機制,導致故障的排障周期長,MTTR增加。

Bonree Server 助力政務系統(tǒng)全面可觀測
基于該政務系統(tǒng)面臨的問題,博睿數據認為對于該政務系統(tǒng)而言,他們需要的是監(jiān)控整個業(yè)務鏈條,利用平臺幫助他們梳理各系統(tǒng)調用關系和響應狀態(tài),精確定位問題。再就是監(jiān)測應用自身代碼開發(fā)的合理性,協(xié)助開發(fā)人員進行應用優(yōu)化。
Bonree Server 是博睿數據的一款應用性能監(jiān)控產品,面向業(yè)務、研發(fā)、運維、SRE、安全等數字化工作人員,在業(yè)務發(fā)布、監(jiān)控、故障恢復、緊急支持、管理規(guī)劃等工作時做到心中有數、行動有方、高效從容。

Bonree Server采用被動式監(jiān)控,通過在服務器上的應用部署或者嵌入探針進行,以Javaagent為例:采用字節(jié)碼增強式埋點方式,在啟動JVM時,通過不同的埋點插件覆蓋不同的通信協(xié)議、中間件、開發(fā)框架,對Java基礎調用代碼進行函數級埋點,從而拿到堆棧級的調用信息以及運行態(tài)信息。
在應用架構可視化方面,基于 Bonree Server 產品探針自動拓撲展示應用調用架構,將原本不可見的業(yè)務系統(tǒng)間復雜調用邏輯進行可視化展示,完成自動拓撲可視化從無到有的轉變,幫助運維人員清晰系統(tǒng)架構,提高運維工作效率。

在故障定位方面,幫助該政務系統(tǒng)重新定義客戶排障流程,通過點擊分析可以快速定位耗時較長的關鍵業(yè)務,從而實現(xiàn)數據可視化-確定故障域-定位故障點的排障流程,最終實現(xiàn)由小時級定位到分鐘級發(fā)現(xiàn)問題。
