6 月 1 日在阿里云粵港澳大灣區(qū)云峰會(huì)上,阿里云智能云原生應(yīng)用平臺(tái)總經(jīng)理丁宇宣布,Serverless 容器服務(wù) ASK全面升級(jí),進(jìn)一步幫助企業(yè)和開(kāi)發(fā)者降本提效。
Gartner 曾預(yù)測(cè),2023 年 70% 的 AI 應(yīng)用將基于容器和 Serverless 技術(shù)開(kāi)發(fā)。作為云原生的重要技術(shù)組成,K8s 已經(jīng)被開(kāi)發(fā)者和企業(yè)廣泛認(rèn)可,然而其自身復(fù)雜性和陡峭的學(xué)習(xí)曲線(xiàn)依然讓人望而生畏。
阿里云在 2018 年發(fā)布了首個(gè)Serverless容器服務(wù)ASK,其本質(zhì)是將容器的運(yùn)行時(shí)和具體的節(jié)點(diǎn)運(yùn)行環(huán)境解耦,讓用戶(hù)無(wú)需管理K8s節(jié)點(diǎn)和服務(wù)器,即可直接部署應(yīng)用,大幅降低容器服務(wù)的使用門(mén)檻。目前,ASK在容器化應(yīng)用、在線(xiàn)業(yè)務(wù)彈性、AI/大數(shù)據(jù)計(jì)算類(lèi)任務(wù)等場(chǎng)景中被廣泛使用。
此次 ASK 的全新升級(jí),進(jìn)一步整合了阿里云基礎(chǔ)設(shè)施的能力,在使用成本、創(chuàng)建效率、異構(gòu)資源兼容、彈性供給保障等方面帶來(lái)顯著提升,解決開(kāi)發(fā)者在使用K8s的復(fù)雜性挑戰(zhàn),也順應(yīng)了 AI場(chǎng)景爆發(fā)下催生的新需求。
丁宇介紹,本次ASK升級(jí)涵蓋了多個(gè)維度,包括對(duì)組件的全托管支持、AI鏡像的秒級(jí)拉取能力,還降低了客戶(hù)的使用成本。具體來(lái)說(shuō):
1、組件全托管,零K8s運(yùn)維成本
ASK新增對(duì) CoreDNS、Metrics Server 等十多個(gè) K8s 核心組件的托管支持,提供動(dòng)態(tài)容量規(guī)劃能力,客戶(hù)無(wú)需自行部署維護(hù),最大化降低運(yùn)維復(fù)雜度。同時(shí),ASK也新增了智能化風(fēng)險(xiǎn)識(shí)別能力,支持自動(dòng)化升級(jí)K8s版本,避免升級(jí)導(dǎo)致的應(yīng)用故障或異常風(fēng)險(xiǎn)。
2、極致彈性,準(zhǔn)確率提升80%
ASK 提供首界首創(chuàng)基于容器鏡像緩存的 AI 大鏡像秒級(jí)拉取能力,AI 應(yīng)用啟動(dòng)時(shí)間降低90%。并且提供端到端的彈性加速,面向AI/大數(shù)據(jù)工作負(fù)載容器化進(jìn)行全棧優(yōu)化,通過(guò)數(shù)據(jù)集加速提升 30% 訪(fǎng)問(wèn)性能;此外,本次 ASK 還增強(qiáng)了智能彈性預(yù)測(cè) AHPA能力,相比人工配置,彈性準(zhǔn)確率提升 80%;同時(shí)新增對(duì)于 GPU 的支持。
3、普惠算力,性?xún)r(jià)比提升40%
為了給客戶(hù)提供更好的服務(wù),釋放技術(shù)紅利,讓算力更普惠,ASK新增U實(shí)例規(guī)格支持,統(tǒng)一支持多款處理器,相比上一代主售實(shí)例降價(jià)高達(dá)40%。新增SavingPlan彈性版本,面向應(yīng)用非固定波峰波谷場(chǎng)景,額外成本優(yōu)化10%以上。為進(jìn)一步讓價(jià)格更透明,新增成本套件支持,清晰洞察彈性資源成本,讓成本治理更便捷。
以數(shù)禾科技為例,這是一家為金融機(jī)構(gòu)提供高效的智能零售金融解決方案的公司,對(duì)于模型的計(jì)算能力包括計(jì)算速度、計(jì)算結(jié)果準(zhǔn)確性、計(jì)算數(shù)據(jù)實(shí)時(shí)性等,有很高的要求。而當(dāng)前的困擾是支撐模型計(jì)算的底層應(yīng)用資源無(wú)法根據(jù)請(qǐng)求量來(lái)調(diào)整機(jī)器資源支持運(yùn)算能力,這也是當(dāng)前業(yè)務(wù)快速發(fā)展過(guò)程中亟待解決的痛點(diǎn)。同時(shí),隨著模型在線(xiàn)推理服務(wù)數(shù)量的增加,數(shù)禾的模型服務(wù)也變得越來(lái)越龐大、臃腫,難以管理。這種狀況不僅導(dǎo)致了資源浪費(fèi),還增加了維護(hù)和升級(jí)的成本。
為了解決這些“頑疾”,數(shù)禾科技采用阿里云 ASK 部署線(xiàn)上模型,無(wú)需 K8s 節(jié)點(diǎn)管理,根據(jù)實(shí)時(shí)流量動(dòng)態(tài)使用 POD,資源成本節(jié)省60%;通過(guò) ASK Knative 服務(wù),解決了數(shù)禾模型的灰度發(fā)布和多版本并存問(wèn)題;得益于ASK 自動(dòng)伸縮和縮容到 0 的優(yōu)勢(shì),降低運(yùn)行成本,大幅提升服務(wù)可用性。
“使用阿里云容器服務(wù) Knative 和 ECI 虛擬節(jié)點(diǎn)配合部署,保證線(xiàn)上模型應(yīng)對(duì)突發(fā)流量的穩(wěn)定性提升的同時(shí),又使資源利用效率顯著提高,極大地節(jié)約了資源成本。”數(shù)禾科技 AI 實(shí)驗(yàn)室 AI 平臺(tái)負(fù)責(zé)人周偉鵬表示。
目前,ASK 已加入阿里云飛天免費(fèi)試用計(jì)劃,為開(kāi)發(fā)者、企業(yè)提供一定額度的免費(fèi)試用資源。3分鐘就可以創(chuàng)建Kubernetes集群,開(kāi)啟容器彈性之旅。
審核編輯黃宇
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270352 -
阿里云
+關(guān)注
關(guān)注
3文章
975瀏覽量
43235 -
serverless
+關(guān)注
關(guān)注
0文章
65瀏覽量
4521
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
MLOps托管服務(wù)怎么樣
阿里云升級(jí)通義靈碼AI程序員,全面上線(xiàn)
華為云 X 實(shí)例的鏡像管理詳解
![華為<b class='flag-5'>云</b> X 實(shí)例的<b class='flag-5'>鏡像</b>管理詳解](https://file1.elecfans.com//web3/M00/05/29/wKgZO2d87WCAUbD8AACKsQT93Ao991.png)
Amazon Bedrock全新升級(jí),新增業(yè)界領(lǐng)先的AI防護(hù)、新智能體功能和模型定制能力
阿里云代理有哪些?
AI模型托管原理分析
螞蟻數(shù)科以AI全面升級(jí)云產(chǎn)品
容器云服務(wù)引擎是什么?如何使用
華為云全域 Serverless 8 月更新盤(pán)點(diǎn)
![華為<b class='flag-5'>云</b>全域 <b class='flag-5'>Serverless</b> 8 月更新盤(pán)點(diǎn)](https://file1.elecfans.com/web2/M00/08/38/wKgZomb2LTmARTYFAAptR_m4TQ0890.png)
評(píng)論