9 月 19 日,華為全聯接大會 2024 舉辦期間,在“AI 賦能應用現代化,加速軟件生產力躍升”為主題的論壇上,華為云發布全棧可觀測平臺AOM,以 AI 賦能應用運維可觀測,提升企業應用可用性與穩定性。
該平臺發布標志著華為云在推動數字化轉型和智能化運維領域的又一重大突破,全棧可觀測平臺的推出不僅為企業提供了更加全面和深入的系統監控和數據分析能力,還通過集成先進的人工智能技術,實現了對復雜應用環境的實時優化和問題預警。
應用運維管理(Application Operations Management,簡稱 AOM)是云上應用一站式可觀測性分析平臺,基于四層指標體系(業務層指標、應用層指標、中間件層指標、基礎設施層),提供指標、日志、調用鏈 3 類數據關聯分析、根因分析、場景化分析等可觀測分析能力,全面掌握應用、資源實時運行狀況,及時發現故障。
華為云 AOM 主要能力
全場景數據接入,統一監控大盤與告警管理:統一接入中心實現 4 層指標體系數據上報,提供可視化圖表統一匯總呈現指標、日志信息,統一告警規則配置、開箱即用告警模板以及智能告警降噪。
全鏈路調用鏈分析,智能化代碼級剖析 Profiling:支持調用鏈路時序圖,直觀展示 Web 端、App 端到后端服務、數據庫、中間件鏈路關系,用戶一站式定位故障鏈路,快速發現消耗資源的代碼,定位 CPU、內存、時延性能問題。
容器監控體系洞察:支持集群維度、核心插件、節點、負載、外部 5 大檢測維度、16 個巡檢場景、49 個檢測項診斷,實施掌握容器健康狀態。
海量日志引擎:自主創新的高性能搜索引擎,存算分離架構,多租戶共享海量彈性計算資源,實現百億級日志 3 秒內返回搜索結果,提供日志結構化解析組合編排、高性能 SQL 分析、一站式日志加工等能力。
華為云 PaaS 服務產品部部長徐峰對 AIOps 領域的發展做了系統性的規劃與展望,未來 AIOps 將是小模型與大模型結合使用,小模型聚焦故障感知定位解決量化確定性問題,大模型面向故障修復決策提升運維輔助人效,從 AI 故障感知、AI 故障定位、AI 生成故障修復建議三個方面構筑未來智能可觀測產品力。
故障感知:通過多維指標智能聚合與故障預測算法,面向 AnyStack 與 AnyWhere 數據實時分析,實現應用故障 1 分鐘及時發現。
故障定位:通過告警相關性分析、水平 &垂直關聯分析能力實現場景化根因分析,5 分鐘完成故障定位診斷。
故障決策與修復:生成式算法結合華為 SRE 運維經驗和案例庫,覆蓋應用到資源各類場景問題的解決方案,提供精準修復建議,10 分鐘完成應用故障修復閉環。
會上,上海松鼠云上人工智能技術有限公司(簡稱松鼠 AI)技術 VP 劉海濤分享了松鼠 AI 基于華為云 AOM 在智慧教育領域的實踐。
松鼠 AI 基于華為云 AOM 構建 Ai 智適應學習系統一站式可觀測性分析能力,融合指標、日志、調用鏈 3 類數據,實時掌握應用健康狀態,通過數據關聯、根因診斷、場景化分析等可觀測能力,做到應用運維問題早發現早消除,全面保證 Ai 智適應學習系統的健康、平穩運轉。
未來,華為云應用運維管理 AOM 將持續聚焦可觀測領域,利用 AI 賦能應用智能可觀測,推動數字化轉型和智能化升級,面向用戶提供更高效、精準的監控和分析解決方案,通過智能化的數據處理和分析能力,為客戶提供全方位的系統洞察,在復雜的業務環境中快速識別潛在風險,優化操作流程,提升業務效益,顯著降低運維成本。
審核編輯 黃宇
-
AI
+關注
關注
87文章
31513瀏覽量
270307 -
華為云
+關注
關注
3文章
2682瀏覽量
17586
發布評論請先 登錄
相關推薦
江波龍全棧定制方案亮相2024數字科技生態大會,PTM賦能電信云服務

華為云全棧可觀測平臺——9 月 10 月新功能特性

eBPF技術實踐之virtio-net網卡隊列可觀測

破局新生丨基調聽云可觀測性與應用安全技術研討會在平潭圓滿舉辦

【質量視角】可觀測性背景下的質量保障思路

評論