人工智能處理器需要大量的電力,而較低的能效對應于整個配電網絡(PDN)的損耗增加。如何解決保持效率和實現高質量算法執行的挑戰?Vicor 的 PE 公司副總裁 Robert Gendron 在接受 EEWeb 采訪時指出,由于加入了 AI、機器學習和深度學習,數據中心的機架功率已躍升了 200% 以上,達到 20 kW 范圍. 這促使 Vicor 使用 48-V 解決方案重新評估其 PDN,雖然重新設計解決了高電流 PDN 問題,但也給電源轉換帶來了新的挑戰。
圖 1:CPU/FPGA 峰值電流要求的進展(來源:Vicor)
對 PDN 的需求飆升
供電和電源效率已成為大規模計算系統中最大的問題(圖 1)。隨著處理復雜 AI 功能的 ASIC 和 GPU 的出現,該行業見證了處理器功耗的急劇增加。機架電源需求也與在大規模學習和推理應用程序部署中使用的 AI 能力成正比。在大多數情況下,供電現在是計算性能的限制因素,因為新 CPU 希望消耗不斷增加的電流。最佳電力傳輸不僅需要電力分配,還需要效率、尺寸、成本和熱性能。
為了支持大量的數據計算,傳統的 PDN 需要承受巨大的功率需求,從而影響熱管理。通過延長 PDN 系統的電纜來降低電阻或增加工作電壓以降低電流是兩種選擇。為了滿足功率的增加,現代設計正在采用第二種選擇來更有效地滿足數據中心的嚴格要求。
“目前,電力需求遠遠超過傳統的電力輸送網絡,”Gendron 說。“切換到 48V 架構并采用更具創新性的供電方法是提供高性能電源以滿足驚人的 AI/HPC 需求的唯一途徑。”
當 2015 年處理器能力開始大幅增加時,擁有最多云、服務器和 CPU 公司成員的開放計算項目 (OCP) 聯盟繼續改進其 12-V 機架設計。響應是從電纜切換到母線,并在機架內部署更多 12V 單相交流轉換器,以最大限度地減少 PDN 距離和服務器刀片的阻力。主要的變化是,由于功率增加,單相交流電是從三相電源的各個相位派生到機架的。隨后,在具有 500-A 至 1,000-A 處理器的數據中心中引入 AI,促使一些公司轉向 48-V 配電。這將 12 kW 機架的高電流 PDN 問題減少到 250 A,但給整個系統的電源轉換帶來了新的挑戰。由于為刀片供電的 PDN 正在切換到 48 V,因此需要對刀片進行電源轉換更改。在任何情況下,從 12V 配電切換到 48V 都會將輸入電流要求降低 4 倍,并將損耗降低 16 倍。
采用 48V 架構
48 V 用于可充電備用電池系統,為電信設備供電。這些系統中傳統上使用的通用架構稱為中間總線架構,它由一個隔離的未穩壓總線轉換器組成,用于將 48 V 轉換為 12 V,然后將其饋送到一組多相降壓穩壓器以處理到 12 V 的轉換和調節負載點 (PoL)。隨著 AI 處理器和 CPU 電流的增加,由于穩壓器和 PoL 之間的 PDN 電阻,PoL 的供電解決方案的密度成為 AI 應用中最關鍵的元素。PDN 損耗是計算 DC/DC 穩壓器設計效率和性能的主要因素。
為了減少損耗,Vicor 建議使用 48V 預調節模塊 (PRM),然后使用固定比率(1/K 因子)變壓級 (VTM)。這種專有架構允許優化每個階段的性能。
PRM 使用零電壓開關拓撲,而 VTM 使用專有的高頻正弦振幅轉換器 (SAC) 拓撲。VTM 可以看作是一個 DC/DC 變壓器,電壓比為 1/K,電流比為 K。VTM 提供高功率密度,并且可以非常靠近處理器放置。
VTM 采用 SAC 拓撲,因此與多相開關及其相關電感器相比,其輻射低且窄帶。它還提供比多相設計更高的功率密度,單個 VTM 取代了六個多相開關級。VTM 占用空間小,完全符合支持四通道內存的高級處理器的布局限制,而不會占用內存子系統的布局區域。
圖 2:橫向供電(來源:Vicor)
大電流傳輸是通過模塊化電流倍增器 (MCM) 模塊提供的,這些模塊靠近處理器放置在主板上或處理器基板上。在基板上放置 MCM 可最大限度地減少 PDN 損耗并減少電源所需的處理器基板 BGA 引腳數量。LPD 旨在支持 OCP 加速器模塊卡和定制 AI 加速器卡的供電需求和獨特的外形。
圖 3:垂直供電(來源:Vicor)
垂直供電 (VPD) 進一步消除了配電損耗和 VR PCB 板面積消耗。VPD 在設計上與 Vicor LPD 解決方案相似,只是將旁路電容集成到電流倍增器或齒輪電流倍增器 (GCM) 模塊中。
根據處理器電流,工程師可以在橫向供電 (LPD) 或 VPD 之間進行選擇。在前一種情況下,電流倍增器位于 AI 處理器旁邊,位于同一基板上或直接位于主板上幾毫米之內,使 PDN 降低到約 50 μΩ。為了獲得更高的性能,VPD 將電流倍增器直接移到處理器下方,還集成了高頻接地電容器。這種類型的電流倍增器稱為齒輪電流倍增器。VPD 將 PDN 電阻降低到 5–7 μΩ,讓 AI 處理器可以自由地利用全部功率。
圖 4:該 AI 解決方案重點介紹了 Vicor 48V 直接負載 VR 解決方案,支持高達 650A 的連續電流和超過 1,000A 的峰值電流傳輸。(來源:Vicor)
最大化 AI 處理器性能
高級 AI 處理器加速模塊的典型 Vicor VR 解決方案如圖 4 所示。 Vicor VR 由三個動力總成模塊、一個模塊化電流驅動器 (MCD) 和兩個 MCM 組成,提供 48-V輸入至 0.8-V輸出VR 具有高達 650 A 的連續電流和超過 1,000 A 的峰值電流傳輸能力。就像飛機的噴氣燃料一樣,這種供電水平可確保 AI 處理器以最佳時鐘頻率運行并最大限度地提高性能。
Gendron 說:“如果我們的技術沒有用于這些高級 AI 應用程序,多相 VR 設備的數量將超過電路板尺寸,并且不會保持相同的外形尺寸。” “此外,噪聲貢獻很可能太高而無法保持信號完整性。”
通過使用Vicor NBM2317,可保持與傳統 12V 服務器機架配電的兼容性,并為 Vicor VR 提供 48V 電壓。這種 12-V 至 48-V 轉換器也可以在“相反”方向運行,從而實現 48-V 至 12-V 的轉換。
傳統的電源架構跟不上當今耗電的 AI 處理器及其在云計算中的采用。Vicor 電源方法支持 48V 配電和支持高級 AI 處理需求的 VR。與 CPU 使用的傳統多相設計不同,Vicor 解決方案專為解決在云服務器中快速遷移的新型處理器而開發。
需要一種為 AI/HPC 提供動力的新方法。隨著領先公司在電源方面不斷突破,從云服務器機架分配 12 V 電源已不再可行。為當今的 ASIC 和 GPU 供電需要的不僅僅是通過更換部件來增加功率。最有效的解決方案從高壓電源開始,結合創新的架構和拓撲,并使用高效的高密度電源模塊。
文章來源:eeweb
編輯:ymf
-
asic
+關注
關注
34文章
1206瀏覽量
120755 -
PDN
+關注
關注
0文章
83瀏覽量
22759 -
AI處理器
+關注
關注
0文章
92瀏覽量
9545
發布評論請先 登錄
相關推薦
評論