6月6日,京東云城市大會成都站期間,京東云正式發(fā)布了混合多云智能運(yùn)維平臺。
通過引入AI大模型能力,疊加多年積累的運(yùn)維數(shù)據(jù),智能運(yùn)維平臺實(shí)現(xiàn)了端到端的全鏈路應(yīng)用監(jiān)控,可快速梳理業(yè)務(wù)鏈路的根因定位,鎖定故障節(jié)點(diǎn),給出處理建議,從而極大提升運(yùn)維效率。

京東云相關(guān)負(fù)責(zé)人介紹,智能運(yùn)維平臺已大規(guī)模應(yīng)用于京東內(nèi)部場景,支持618、11.11等高并發(fā)和復(fù)雜業(yè)務(wù)場景,QPS達(dá)千萬級流量時(shí),可用率仍可高達(dá)99.99%,為業(yè)務(wù)應(yīng)用穩(wěn)定運(yùn)行提供保障。
京東618承載了最極端的流量,是全球最復(fù)雜的業(yè)務(wù)場景之一。
618活動不僅涉及的系統(tǒng)多,而且業(yè)務(wù)鏈條長,為了保障大促活動的正常進(jìn)行,需要對業(yè)務(wù)系統(tǒng)各項(xiàng)性能和可用性指標(biāo)進(jìn)行全鏈路實(shí)時(shí)監(jiān)控,當(dāng)業(yè)務(wù)發(fā)生錯誤或者性能遇到瓶頸等問題時(shí),需要能夠迅速發(fā)現(xiàn)并定位根因,提升運(yùn)維排障效率。
源于多年京東業(yè)務(wù)場景實(shí)踐,京東云自研的混合多云智能運(yùn)維平臺,通過接入AI大模型能力,提供從移動App、網(wǎng)頁H5應(yīng)用、小程序,到網(wǎng)關(guān)、后端服務(wù)和中間件的全鏈路監(jiān)控服務(wù),具備分布式的應(yīng)用性能分析與故障自檢告警能力,通過將專家語料庫和AI大模型算法融合生成式故障診斷方案,在復(fù)雜的業(yè)務(wù)架構(gòu)下也能實(shí)時(shí)掌握全棧性能情況,快速定位故障,提高故障恢復(fù)速度。
在京東內(nèi)部場景,智能運(yùn)維平臺服務(wù)端已接入了數(shù)千個后端應(yīng)用, 幫助開發(fā)運(yùn)維人員實(shí)時(shí)發(fā)現(xiàn)服務(wù)運(yùn)行過程中的問題,定位根因,并快速解決,實(shí)現(xiàn)1分鐘發(fā)現(xiàn),5分鐘定位,10分鐘解決,提升服務(wù)穩(wěn)定性。
四大領(lǐng)先優(yōu)勢,讓運(yùn)維工作更簡單、更高效
歷經(jīng)多年京東內(nèi)部場景打磨,智能運(yùn)維平臺構(gòu)建了四大領(lǐng)先優(yōu)勢能力。
在全鏈路追蹤方面,涵蓋了移動端、前端、服務(wù)端性能監(jiān)控,將三端鏈路自動串聯(lián)分析,可觀測每一次服務(wù)調(diào)用鏈路及性能指標(biāo),實(shí)現(xiàn)端到端的性能監(jiān)控和問題定位。
在智能告警方面,根據(jù)不同應(yīng)用靈活配置不同指標(biāo)的基線和閾值,提供多種渠道的告警收斂與告警合并等能力。
在智能容量預(yù)估方面,無需線上壓測,可根據(jù)線上生產(chǎn)數(shù)據(jù)科學(xué)擬合出容量水位數(shù)據(jù),提供擴(kuò)縮容建議。
在零代碼侵入方面,基于java字節(jié)碼增強(qiáng)技術(shù),無需修改業(yè)務(wù)代碼開箱即用,同時(shí)根據(jù)調(diào)用情況匯聚調(diào)用關(guān)系,立體化展示調(diào)用拓?fù)浼懊總€節(jié)點(diǎn)的實(shí)時(shí)性能。
除了服務(wù)于京東內(nèi)部場景,京東云混合多云智能運(yùn)維平臺也廣泛服務(wù)于外部眾多客戶。
某農(nóng)商銀行在京東云金融級 PaaS平臺支持下,實(shí)現(xiàn)技術(shù)架構(gòu)轉(zhuǎn)型,支持互聯(lián)網(wǎng)信貸、交易銀行業(yè)務(wù)快速發(fā)展。其中,京東云混合多云智能運(yùn)維平臺以極簡的接入體驗(yàn),秒級監(jiān)控功能和海量的處理能力,輕松保障了行內(nèi)應(yīng)用的穩(wěn)定調(diào)用。
面向未來,京東云混合多云智能運(yùn)維平臺將持續(xù)打磨AI能力,在AI智能故障報(bào)警、AI智能故障分析、AI智能故障處理,AI故障處理建議等方面繼續(xù)深耕,提供更加簡單、高效的運(yùn)維服務(wù)。
本文源自金融界資訊