以往手機廠商在推出新機型時,其宣傳的賣點常常集中在攝像頭、顯示屏、待機時長這些參數上。在人間處處皆AI(人工智能)的背景下,他們的宣傳重點也要轉向了。比如不久前新面世的驍龍8至尊版移動平臺,其主要“賣點”就是可以實現在終端側多模態生成式AI應用。
而當我們從終端再看向“云端”,數據中心作為人類數字生活背后看不見的引擎,管理著從視頻流到云計算的巨大信息流,在AI應用大爆發的背景下,隨著對數據存儲和處理需求的增長,數據中心更智能、更高效和可持續發展的壓力也在增加。
根據Flexential 2024年人工智能基礎設施狀況報告,59%擁有人工智能路線圖的組織正在加大基礎設施投資,以滿足日益增長的人工智能工作負載需求,為更強大、更可持續、更具成本效益的新一代數據中心奠定基礎。
新一代數據中心的能耗挑戰
新一代數據中心的構建中,有諸多挑戰。其中,能耗可以說是尤為關鍵的一環。
眾所周知,數據中心是巨大的能源消耗者。以谷歌搜索為例,一個查詢約需0.3W時,而在市場上日漸火爆的ChatGPT則需要2.9W時的電力,平均而言,處理一個ChatGPT查詢所需的電量幾乎是谷歌搜索的10倍。
根據國際能源署的統計,數據中心約占全球電力需求的1-2%,十年后,這一比例可能會上升到3-4%。國際能源署(IEA)近期發布的《2024年電力報告》顯示,到2026年,全球數據中心的電力需求將從2022年的不足50太瓦(TW)快速攀升至90TW。另一項統計數據表明,從2021年到2024年底,僅Nvidia一家公司就出貨500萬臺H100及以上版本的加速器(大部分是H100的出貨量),為此,Semianalysis預計,到2025年初,人工智能數據中心的電力需求將超過10吉瓦(GW)。
從電網到處理器
提升電源轉化效率
隨著越來越多的處理器被安裝到服務器機架中,為滿足數據中心不斷增加的需求,所提供電力的功率密度要比以往更高。在此過程中,為了處理一個AI支持的請求,能量從電網到處理器須經四次轉換,這期間可能會導致大約12%的能量損失。
為了應對這一挑戰,眾多技術廠商正在為不斷推出優化的解決方案。
1onsemi高能效數據中心電源解決方案
onsemi的T10 PowerTrench系列和Elite SiC 650V MOSFET組合專為數據中心應用提供了一種高效的電源解決方案,數據中心因此能將功耗降低約1%。如果在全球數據中心實施,該解決方案每年可以減少10TW的能耗,相當于每年為近100萬戶家庭提供全部電力所需的能源。
其中,Elite SiC 650V MOSFET具有卓越的開關性能和較低的器件電容,可在數據中心和儲能系統中實現更高的效率。與上一代產品相比,這款新一代碳化硅(SiC)MOSFET將柵極電荷減半,并將存儲在輸出電容(Eoss)和輸出電荷(Qoss)中的能量減少了44%。與超級結(SJ)MOSFET相比,它們在關斷過程中沒有尾電流,在高溫下具有優異的性能,顯著降低了開關損耗。
T10 PowerTrench MOSFET系列是專為處理高電流而設計的產品,這一點對DC-DC功率轉換級至關重要,并在緊湊的占地面積內提供更高的功率密度和卓越的熱性能。通過屏蔽柵極溝槽設計,T10 PowerTrench MOSFET實現了具有超低柵極電荷和小于1mΩ的導通電阻RDS(on)。此外,軟恢復體二極管和較低的Qrr有效減少了振鈴、過沖和電氣噪聲,從而確保了在壓力下的極佳性能、可靠性和穩健性。
T10 PowerTrench系列和Elite SiC 650V MOSFET組合方案還符合超大規模運營商支持的下一代高功率處理器所需的嚴格的開放式機架V3(ORV3)基本規范。
除了必要的電子元器件,數據中心配電架的連接器的設計也必須能夠提供高效率。連接電阻損失的電能不僅增加了運營成本,還會導致設備的熱負荷增加。
Molex的PowerPlane 母排電源連接器可助力數據中心快速完成電源部署,且不需要額外的電纜和組件安裝。該連接器的對準精度高達+/- 1.00毫米,既能確保準確的插配,還支持更高的能源效率。多個獨立的接觸點提高了設計的靈活性,浮動式安裝設計非常適合那些難以觸及區域的盲插。
此外,兩側的可選感應觸點還能實現控制器的熱插拔,而有了可選的集成式機箱接地觸點,就不必單獨進行二次接地連接。另外,PowerPlane電纜組件還符合OCP ORV3標準,滿足數據中心配電架構的需求。
利用AI優化數據中心的能源效率
值得一提的是,一方面數據中心正在通過技術升級為更大規模的AI應用賦能,與此同時,其自身也在利用AI所驅動的自動化、數據分析和機器學習,并從中獲益。簡言之,數據中心既是AI應用的驅動者,也AI技術的收益者。
具體到數據中心的能耗管理,眾所周知,在數據中心中冷卻系統是能源消耗大戶,然而傳統的冷卻方法對于高性能計算(HPC)的需求效率低下,導致能耗過高和運營成本的增加。在不影響性能的情況下,人工智能可以根據實時數據動態調整冷卻系統,優化能源使用。
例如,谷歌的DeepMind JEST人工智能工具已經能夠降低其數據中心的能耗,展示了人工智能使設施更節能的巨大潛力。
目前,人工智能正在成為提升數據中心能源效率的強大工具,主要體現在三個方面:
一是數據中心可以使用人工智能來預測冷卻系統問題,并允許系統提前進行調整以防止停機并保持極佳效率。這種主動的預測性維護方法將意外故障減少了70%,維護成本降低了約25%。
二是利用人工智能可實現動態冷卻管理。數據中心的冷卻系統對于保持極佳工作溫度、防止過熱以及確保服務器和其他設備的可靠性至關重要。然而,冷卻系統屬于能源密集型,它們通常消耗設施總用電量的40%左右。由人工智能驅動的動態冷卻提供了一種持續分析溫度數據并實時調整冷卻水平的解決方案。這種智能方法優化了冷卻效率,并在任何時候均可提供所需的精確量,且不依賴于靜態設置。
三是利用人工智能可實現智能儲能管理。人工智能和機器學習通過分析消耗模式和預測峰值使用時間來優化能源的使用和存儲,減少了高需求時期對電網的依賴。使用人工智能管理能源存儲的數據中心可以在需要時無縫過渡到備用電源,從而極大限度地減少停機時間并降低運營成本。
小結
人工智能是一項基石技術,它的爆炸式增長是數據中心需求激增的關鍵。傳統數據中心主要關注存儲和處理需求,而人工智能數據中心則需要更先進的基礎設施、更高的計算能力和能效升級的支撐。隨著各行業數字化轉型的勢頭日益增強以及電力密集型人工智能應用的增加,全球對數據服務的需求呈指數級增長。
在快速增長過程中,數據中心建設面臨著諸多挑戰,目前非常緊迫的一點就是能源效率問題。麥肯錫的數據顯示,2022年數據中心的年功耗為17吉瓦(GW),到2030年,預計將達到35 GW。為了應對這一挑戰,具有更高源效的電子元器件對新一代數據中心的健康發展顯得尤為重要。
與此同時,將人工智能集成到數據中心可以改變這些基礎設施的運作和發展方式,例如,數據中心可以使用人工智能工具來管理其處理的設施和工作負載,此外,人工智能還可以幫助數據中心管理員完成各種任務,包括電源控制、能耗監控、維護更新和網絡安全等。尤其是針對數據中心不斷增長的功率密度需求,人工智能通過分析使用模式和實時調整冷卻系統或優化服務器工作負載來優化能耗,從而極大限度地減少能源浪費。這些調整不僅降低了運營成本,而且通過減少對環境的影響,幫助數據中心實現可持續發展目標。
-
數據中心
+關注
關注
16文章
4858瀏覽量
72380 -
人工智能
+關注
關注
1796文章
47666瀏覽量
240263 -
能耗
+關注
關注
1文章
354瀏覽量
12968
原文標題:新一代數據中心的能耗挑戰,我們該如何應對?
文章出處:【微信號:貿澤電子,微信公眾號:貿澤電子】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論