2023年7月27日-28日,第十七屆iTall金融科創(chuàng)峰會(huì)于上海圓滿召開(kāi),來(lái)自金融企業(yè)及優(yōu)質(zhì)金融科技供應(yīng)商的百位中高層嘉賓代表共聚現(xiàn)場(chǎng)。

基調(diào)聽(tīng)云受邀出席活動(dòng),技術(shù)總監(jiān)王雅志在會(huì)中分享了題為《業(yè)務(wù)視角下的可觀測(cè)性平臺(tái)建設(shè)實(shí)戰(zhàn)經(jīng)驗(yàn)》的專(zhuān)題演講。

可觀測(cè)能力是數(shù)字化轉(zhuǎn)型必備工具

數(shù)字化轉(zhuǎn)型已成為熱門(mén)話題,大家對(duì)于數(shù)字化轉(zhuǎn)型的重要性已有一定認(rèn)識(shí)。根據(jù)咨詢(xún)機(jī)構(gòu)的分析報(bào)告,91%的企業(yè)正在計(jì)劃進(jìn)行數(shù)字化轉(zhuǎn)型,87%的企業(yè)認(rèn)為數(shù)字化轉(zhuǎn)型可能顛覆行業(yè)。從另一個(gè)角度分析,數(shù)字化轉(zhuǎn)型以業(yè)務(wù)為中心,目標(biāo)是提升服務(wù)和用戶(hù)體驗(yàn)。如果企業(yè)在數(shù)字化轉(zhuǎn)型過(guò)程中只關(guān)注系統(tǒng)可用性而忽視用戶(hù)體驗(yàn)評(píng)估,很可能導(dǎo)致數(shù)字化轉(zhuǎn)型失敗。

失敗的原因可能有幾點(diǎn):首先,缺乏對(duì)用戶(hù)體驗(yàn)評(píng)估的關(guān)注和數(shù)據(jù)規(guī)范;其次,新技術(shù)帶來(lái)的運(yùn)維挑戰(zhàn);第三,IT團(tuán)隊(duì)和業(yè)務(wù)部門(mén)之間目標(biāo)不一致,導(dǎo)致數(shù)字化轉(zhuǎn)型受阻。因此,企業(yè)內(nèi)部各個(gè)團(tuán)隊(duì)的目標(biāo)必須一致,才能成功實(shí)現(xiàn)轉(zhuǎn)型。

在金融行業(yè),特別是銀行領(lǐng)域,不管是業(yè)務(wù)上云還是正在面臨的新核心改造,都被統(tǒng)稱(chēng)為新一代架構(gòu)。新一代架構(gòu)需要同時(shí)具備傳統(tǒng)金融和數(shù)字金融下的穩(wěn)定性、安全性、業(yè)務(wù)連續(xù)性和持續(xù)創(chuàng)新的能力。在這個(gè)架構(gòu)的背景下,我們希望通過(guò)持續(xù)提升用戶(hù)體驗(yàn)促進(jìn)業(yè)務(wù)增長(zhǎng),同時(shí)能統(tǒng)一管理龐大的應(yīng)用。然而,現(xiàn)實(shí)情況是我們?cè)诒O(jiān)控工具方面的能力不足,監(jiān)控對(duì)象覆蓋不全,運(yùn)維體系不健全等方面面臨著一些挑戰(zhàn)。

為了解決這些問(wèn)題,我們認(rèn)為可觀測(cè)性是企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中的必備工具。一個(gè)具備自動(dòng)化持續(xù)數(shù)據(jù)采集能力的可觀測(cè)性平臺(tái),并利用AI和技術(shù)進(jìn)行數(shù)據(jù)分析和告警,能形成全??捎^測(cè)性。同時(shí),我們需要衡量用戶(hù)體驗(yàn)和業(yè)務(wù)目標(biāo)的標(biāo)準(zhǔn)。通過(guò)建立統(tǒng)一的平臺(tái)和數(shù)據(jù),促進(jìn)組織內(nèi)部的溝通和協(xié)調(diào)。

可觀測(cè)性平臺(tái)的建設(shè)并非一蹴而就

總的來(lái)說(shuō),可觀測(cè)性平臺(tái)的建設(shè)不是一蹴而就的,需要分階段進(jìn)行。首先,夯實(shí)數(shù)據(jù)基礎(chǔ),完善可觀測(cè)性數(shù)據(jù)。然后進(jìn)行數(shù)據(jù)治理,按照分層標(biāo)準(zhǔn)實(shí)現(xiàn)數(shù)據(jù)互通。最后,增強(qiáng)可觀測(cè)性,利用AI和機(jī)器學(xué)習(xí)實(shí)現(xiàn)落地場(chǎng)景。

通過(guò)這三個(gè)階段完成可觀測(cè)平臺(tái)的建設(shè)。這三個(gè)階段被稱(chēng)為融匯、融通和融智。接下來(lái),我將從這三個(gè)方面簡(jiǎn)要介紹具體實(shí)現(xiàn)方式。

在融匯階段,我們需要完善可觀測(cè)性數(shù)據(jù)。為此,我們需要制定標(biāo)準(zhǔn),通過(guò)分層模式確定企業(yè)業(yè)務(wù)架構(gòu)中缺失的數(shù)據(jù),并通過(guò)技術(shù)手段進(jìn)行數(shù)據(jù)采集。在服務(wù)端實(shí)現(xiàn)方面,我們采用一體化探針進(jìn)行數(shù)據(jù)采集,并通過(guò)Opentelemetry標(biāo)準(zhǔn)實(shí)現(xiàn)對(duì)第三方數(shù)據(jù)的采集,利用eBPF技術(shù)完善網(wǎng)絡(luò)指標(biāo)。在用戶(hù)端,我們通過(guò)模擬用戶(hù)體驗(yàn)和真實(shí)用戶(hù)體驗(yàn)采集數(shù)據(jù)。通過(guò)這兩個(gè)階段和維度,完善了整個(gè)可觀測(cè)性數(shù)據(jù)的采集能力。

采集完成后,進(jìn)入融通階段,從兩個(gè)維度來(lái)實(shí)現(xiàn)。首先,從技術(shù)架構(gòu)層面,橫向打通從用戶(hù)端到基礎(chǔ)架構(gòu)端,縱向打通從業(yè)務(wù)到基礎(chǔ)架構(gòu)。第二個(gè)維度是從組織架構(gòu)的角度,通過(guò)數(shù)據(jù)打通實(shí)現(xiàn)業(yè)務(wù)部門(mén)和IT部門(mén)之間的溝通和協(xié)作,達(dá)成一致的目標(biāo)。

在融智階段,強(qiáng)調(diào)基于告警事件和AI能力進(jìn)行數(shù)據(jù)分析。通過(guò)問(wèn)題的回溯機(jī)制,我們可以追溯整個(gè)事件或問(wèn)題的路徑,找到問(wèn)題的根因,確定故障影響的業(yè)務(wù)系統(tǒng)范圍。通過(guò)這種方式,實(shí)現(xiàn)了整個(gè)可觀測(cè)能力構(gòu)建。

案例分享

最后,分享一個(gè)銀行客戶(hù)案例。他們的業(yè)務(wù)系統(tǒng)中80%已經(jīng)上云,采用微服務(wù)架構(gòu),而剩下的20%建立在傳統(tǒng)的穩(wěn)態(tài)架構(gòu)上。在轉(zhuǎn)型過(guò)程中,如何在保證業(yè)務(wù)連續(xù)性和穩(wěn)定性的前提下,實(shí)現(xiàn)業(yè)務(wù)快速迭代和創(chuàng)新。在新一代架構(gòu)和傳統(tǒng)架構(gòu)“并存”情況下,如何保障“敏態(tài)”和“穩(wěn)態(tài)”的IT運(yùn)維,這是他們正在面臨的業(yè)務(wù)挑戰(zhàn)。

我們通過(guò)手機(jī)銀行客戶(hù)端的OneSDK能力,結(jié)合用戶(hù)旅程分析,解決了客戶(hù)的業(yè)務(wù)流程和用戶(hù)體驗(yàn)的監(jiān)控問(wèn)題。

在服務(wù)端方面,我們面臨了一些挑戰(zhàn),客戶(hù)實(shí)際環(huán)境相對(duì)復(fù)雜,核心系統(tǒng)部分采用C語(yǔ)言開(kāi)發(fā),還有部分系統(tǒng)采用私有協(xié)議框架,經(jīng)過(guò)多次交流和討論,最終采用Onetrace+日志溯源方式實(shí)現(xiàn)C語(yǔ)言系統(tǒng)的監(jiān)控,并適配了銀行私有協(xié)議框架。通過(guò)穩(wěn)態(tài)和敏態(tài)的打通,實(shí)現(xiàn)了“雙態(tài)”下的全鏈路追蹤。我們的目標(biāo)是打造最好的智能可觀測(cè)平臺(tái),讓運(yùn)維更簡(jiǎn)單,助力企業(yè)數(shù)字化轉(zhuǎn)型。

基調(diào)聽(tīng)云智能可觀測(cè)性平臺(tái)

基調(diào)聽(tīng)云智能可觀測(cè)性平臺(tái)圍繞企業(yè)的信息化與數(shù)字化業(yè)務(wù)提供一套全面覆蓋終端用戶(hù)體驗(yàn)、應(yīng)用性能、業(yè)務(wù)性能、基礎(chǔ)設(shè)施和多云環(huán)境的基于AI的智能可觀測(cè)性平臺(tái)。經(jīng)過(guò)大量金融、運(yùn)營(yíng)商等客戶(hù)的生產(chǎn)驗(yàn)證,高效保證企業(yè)數(shù)字化業(yè)務(wù)穩(wěn)定運(yùn)行,提高SLA,降低MTTR。該平臺(tái)持續(xù)自動(dòng)化的獲取數(shù)據(jù),輔以AI技術(shù),持續(xù)的自動(dòng)分析,自動(dòng)告警,并能能夠主動(dòng)提供答案,做到全棧的可觀測(cè)性,幫助客戶(hù)持續(xù)優(yōu)化用戶(hù)體驗(yàn)、提高研發(fā)運(yùn)維效率和加快業(yè)務(wù)創(chuàng)新速率,實(shí)現(xiàn)助力企業(yè)加速數(shù)字化轉(zhuǎn)型,提升企業(yè)數(shù)字化競(jìng)爭(zhēng)力。