吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用Multi-Die設計的AI數據中心芯片對40G UCIe IP的需求

新思科技 ? 來源:新思科技 ? 2025-01-09 10:10 ? 次閱讀

越來越多的日常設備開始部署生成式人工智能,市場對大語言模型和出色算力的需求也隨之日益增長。Yole Group在2024年OCP區域峰會的演講過程中表示:“對于訓練參數達到1750億的GPT-3,我們估計需要6000到8000個A100 GPU歷時長達一個月才能完成訓練任務。”不斷提高的HPC和AI計算性能要求正在推動Multi-Die設計的部署,將多個異構或同構裸片集成到一個標準或高級封裝中。為了快速可靠地處理AI工作負載,Multi-Die設計中的Die-to-Die接口必須兼具穩健、低延遲和高帶寬特性,最后一點尤為關鍵。本文概述了利用Multi-Die設計的AI數據中心芯片對40G UCIe IP的需求。

高帶寬Die-to-Die接口用例

AI應用正在給半導體行業帶來新的挑戰。為支持深度學習機器學習算法的海量數據處理任務,對更大帶寬的需求不斷增加,特別是對于計算和網絡應用。這些AI應用對于Die-to-Die接口提出了不同的要求。本文以100Tb網絡交換機和AI加速器為例。

圖1為100Tb交換機示例,該交換機可用于AI數據中心,采用橫向擴展方法來處理跨數據中心的海量數據。橫向擴展方法在機器協同工作的網絡中將工作負載分配到多臺服務器上。交換機SoC不斷擴展,正在接近尺寸極限,因此它被分割成更小的裸片,以提高邊緣使用率。在這種情況下,Die-to-Die接口通過高速以太網在裸片之間以及向外界傳輸大量數據,反之亦然。

59055642-cda9-11ef-9310-92fbcf53809c.png

▲圖1 100Tb交換機的裸片分割用例片

類似Google張量處理單元這樣的AI加速器采用Multi-Die設計,為PCIe和以太網等接口配備單獨的計算裸片和IO裸片。此類AI處理器在更主流的技術工藝上使用IO裸片來節省成本,并在更先進的技術工藝上使用計算裸片來提高性能和能效,從而充分發揮Multi-Die設計的優勢。一些AI加速器使用圖3所示的裸片分割方法,需要高帶寬Die-to-Die接口來無縫傳輸裸片之間的數據。

5927e4c8-cda9-11ef-9310-92fbcf53809c.png

▲圖2 使用AI加速器的裸片分割用例

另一個示例是裸片連接用例,其中主服務器裸片或處理器連接到AI加速器裸片,以便執行可分流到特定功能加速器的任務。在這種用例中,Die-to-Die接口用于在需要時將數據從服務器裸片發送到加速器裸片,而無需在高帶寬下運行。此類用例使用標準封裝技術(如有機襯底),復雜性較低。許多邊緣AI和移動應用都使用此類用例。

59435190-cda9-11ef-9310-92fbcf53809c.png

▲圖3 裸片連接用例

利用40G UCIe IP為Die-to-Die連接提供最大帶寬

UCIe規范已成為Die-to-Die連接的事實標準,確保裸片之間的互操作性、低延遲和實時數據傳輸。得益于UCIe,100Tb交換機和AI加速器等使用Multi-Die設計技術在標準封裝和高級封裝下實現了帶寬效率更高。作為通用芯粒互聯產業聯盟(UCIe Consortium)的成員,新思科技在其當前經驗證的UCIe IP基礎上,推出了40G UCIe IP解決方案,可提供比UCIe規范高25%的帶寬,而不會影響能效或面積。

40G UCIe PHY符合新的UCIe規范,實現了各種功能,可確保Die-to-Die鏈路可靠性和質量。PHY具有全面的可測性設計(DFT)功能,可用于已知良好裸片和生產測試,從而提高了可測試性。嵌入式信號完整性監視器(SIMs)可監測Die-to-Die鏈路的任務模式。監視器可以持續分析Die-to-Die信號質量,并在任務模式下執行校正措施,以實現可靠的通信

PHY在2GHz頻率下支持高達128B的接口寬度,可以利用整個PHY的帶寬。對于必須以較低時鐘頻率運行的系統,它還在1GHz頻率下支持更寬的256B接口。40G UCIe控制器支持不同的接口選項,例如流式傳輸、CXS、AXI,以及PCIe、CXL、AXI和CHI C2C等協議,以在Die-to-Die鏈路上運行標準化數據。

雖然更高的數據速率有助于AI應用實現高帶寬效率并滿足數據處理要求,但也帶來了設計挑戰。開發者必須精心設計通道規格,避免更高的插入損耗和串擾,以實現更優性能。速度較低時,可能不需要對發射器(TX)進行均衡處理。但在速度較高時,為了達到所需的信道性能,就需要進行TX均衡,比如使用2抽頭前饋均衡(FFE)。此外還需要采用更強大的接收器(RX)均衡技術,例如1抽頭決策反饋均衡(DFE)及連續時間線性均衡(CTLE)。Die-to-Die通道需經過大量的信號完整性和電源完整性仿真,以驗證Die-to-Die鏈路特性和性能是否符合預期。

59618d18-cda9-11ef-9310-92fbcf53809c.png

▲圖4 16G奈奎斯特頻率下的有損信道示例

59811476-cda9-11ef-9310-92fbcf53809c.png

▲圖5 良好渠道設計示例

40G UCIe PHY支持新興的先進封裝技術,例如硅或RDL中介層、硅橋和RDL扇出,以及傳統的有機襯底封裝技術。PHY為先進封裝技術提供高達12 Tbps/mm的總帶寬效率,為標準封裝技術提供高達1.8 Tbps/mm的總帶寬效率,同時運行速度高達40Gbps/pin。有機襯底封裝技術雖然更為常見且比較實惠,但需要更多的布線層來支持IP實現更高速的布線。相反,先進封裝技術可以改善布線密度,但也增加了封裝設計所面臨的挑戰。了解到這種復雜性,新思科技提供了用于中介層設計的3DIC Compiler平臺及UCIe-A IP參考設計。3DIC Compiler是統一的探索到簽核解決方案,其中包含用于自動布線和自定義中介層設計的工具和腳本。

40G UCIe IP實現了前向時鐘架構,以簡化接收器架構,從而降低功耗和延遲。其中使用了四倍速率架構,對于32 Gbps/pin速度,PHY操作頻率限制為8 GHz;對于40 Gbps/pin速度,PHY操作頻率限制為10 GHz。此外還借助嵌入式低延遲FIFO來補償前向時鐘和本地時鐘之間以及不同通道之間的偏差不匹配。通用的100MHz參考時鐘用作PHY鎖相環(PLL)的輸入,可生成PHY和控制器所需的所有高頻時鐘,這樣邏輯電路就無需向PHY提供高頻時鐘。圖6為40G UCIe PHY架構。

599bd900-cda9-11ef-9310-92fbcf53809c.png

▲圖6 UCIe PHY架構

UCIe未來的發展道路

3D封裝具有功耗和性能優勢,正逐漸成為快速Multi-Die設計的優選解決方案。

UCIe規范2.0正在促使3D封裝中的Die-to-Die連接實現標準化,與2D和2.5D技術相比,其帶寬更高且功耗更低。UCIe規范為3D封裝定義了以下特性:

簡約的PHY架構,例如簡單的逆變器/驅動器

適合凸塊區域的電路和邏輯,這有助于實現較低的工作頻率和更簡單的電路

較小的凸塊間距,例如幾微米

預定義的Bump-PHY的Bump圖,可簡化互操作性

新思科技利用3DIO IP解決方案實現了3D封裝中的Die-to-Die連接。

3D封裝技術正蓬勃發展,未來幾年對更高數據速率的需求可能會越來越大。Die-to-Die接口也將持續演進,以支持更高的速度和能效。

業界首款40G UCIe IP解決方案,包括控制器、PHY和驗證IP,提供更高算力,可滿足速度更高的基于UCIe的Multi-Die設計需求。PHY的簡化架構簡化了IP集成,全面的監控、測試和修復功能則改善了可靠性和芯片的健康狀況。新思科技走在技術發展的前沿,并將繼續部署先進的IP來適應千變萬化的市場需求。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據中心
    +關注

    關注

    16

    文章

    4857

    瀏覽量

    72377
  • 新思科技
    +關注

    關注

    5

    文章

    807

    瀏覽量

    50424
  • AI芯片
    +關注

    關注

    17

    文章

    1903

    瀏覽量

    35213
  • UCIe
    +關注

    關注

    0

    文章

    48

    瀏覽量

    1650

原文標題:當 AI 芯片遇上帶寬瓶頸,看40G UCIe IP 如何打破僵局?

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Maxim 40G傳輸解決方案有效降低功耗、提高數據吞吐率

    鍵問題。  Maxim近日推出40G發射器芯片組,將數據中心數據吞吐量提高4倍,且保持極低的設備功耗,該方案所占空間僅略高于傳統的單通道。這款最新的4通道
    發表于 12-12 16:36

    請問光學模塊如何進化以滿足數據中心需求

    轉型:現在大多數大型數據中心通常利用10G接入端口訪問40g交換網絡。 然而, 25g接入端口和100G
    發表于 05-23 16:20

    40G光模塊選購指南

    QSFP+光模塊支持4個10Gbps通道同時傳輸,提供40Gbps的傳輸速率,可以用在數據中心、高性能計算網絡、企業核心網絡等應用。40G QSFP+光模塊符合SCSI、40G以太網
    發表于 10-23 15:46

    40G數據中心之銅纜布線

      40G數據中心銅纜布線依然是主流,從前光纖價格過高,因此未能廣泛普及。而隨著科技的不斷進步,大眾對帶寬需求也不斷增長,光纖價格下降并趨于穩定,因此在數據中心綜合布線中開始被廣泛采用
    發表于 11-18 15:00

    為什么25G40G更適合數據中心市場?

    40G和100G已然存在,但為什么還要使用25G?為什么25G40G更適合數據中心市場?
    發表于 05-19 06:59

    2023是否會成為Multi-Die的騰飛之年?

    今年似乎每個人都在討論Multi-Die(集成多個異構小芯片)系統。隨著計算需求激增和摩爾定律放緩,這種將多個異構晶粒或小芯片集成到同一封裝系統中的方式,能夠為實現苛刻PPA、控制成本
    的頭像 發表于 02-09 08:55 ?794次閱讀

    芯片革命:Multi-Die系統引領電子設計進階之路

    是什么推動了Multi-Die系統的發展?由于AI、超大規模數據中心、自動駕駛汽車等應用的高速發展,單片片上系統(SoC)已經不足以滿足人們對芯片
    的頭像 發表于 03-27 22:50 ?1375次閱讀

    態路小課堂丨為40G數據中心綜合布線產品選擇方案!

    點擊藍字 | 關注我們TARLUZ態路 ? 40G QSFP+光模塊、40G QSFP+ DAC和40G QSFP+ AOC都可以應用于40G以太網。如何為
    的頭像 發表于 04-18 09:58 ?928次閱讀
    態路小課堂丨為<b class='flag-5'>40G</b><b class='flag-5'>數據中心</b>綜合布線產品選擇方案!

    Multi-Die系統設計里程碑:UCIe PHY IP在臺積公司N3E工藝上成功流片

    Express (UCIe) PHY IP流片。UCIe IPMulti-Die系統的一個關鍵組成部分,它使開發者能夠在封裝中實現安全和
    的頭像 發表于 05-25 06:05 ?891次閱讀

    設計更簡單,運行更穩健,UCIe標準如何“拿捏”Multi-Die系統?

    如今,從數據中心到邊緣層,再到萬物智能網絡的深處,先進的Multi-Die系統實現了前所未有的性能水平。Multi-Die系統不是通用的單體架構芯片,而是由一系列異構
    的頭像 發表于 07-14 17:45 ?1185次閱讀

    如何成功實現Multi-Die系統的方法學和技術

    Multi-Die系統的基礎構建,亦是如此,全部都需要細致入微的架構規劃。 對于復雜的Multi-Die系統而言,從最初就將架構設計得盡可能正確尤為關鍵。 Multi-Die系統的出現,是為了應對設計規模增加和系統復雜性給摩爾定
    的頭像 發表于 09-22 11:07 ?784次閱讀

    Multi-Die系統驗證很難嗎?Multi-Die系統驗證的三大挑戰

    在當今時代,摩爾定律帶來的收益正在不斷放緩,而Multi-Die系統提供了一種途徑,通過在單個封裝中集成多個異構裸片(小芯片),能夠為計算密集型應用降低功耗并提高性能。
    的頭像 發表于 12-12 17:19 ?1374次閱讀

    如何輕松搞定高性能Multi-Die系統?

    2D芯片設計中通常為二階或三階的效應,在Multi-Die系統中升級為主要效應。
    的頭像 發表于 12-19 17:24 ?709次閱讀

    新思科技發布全球領先的40G UCIe IP,助力多芯片系統設計全面提速

    新思科技40G UCIe IP 全面解決方案為高性能人工智能數據中心芯片中的芯片
    發表于 09-10 13:45 ?446次閱讀

    新思科技發布40G UCIe IP,加速多芯片系統設計

    新思科技近日宣布了一項重大技術突破,正式推出全球領先的40G UCIe(Universal Chiplet Interconnect Express)IP全面解決方案。這一創新成果以每引腳高達
    的頭像 發表于 09-11 17:18 ?671次閱讀
    百家乐官网赌场游戏平台| 百家乐家| 在线玩轮盘| 视频百家乐官网赌法| 澳门百家乐官网群策略| 百家乐投注方法多不多| 百家乐官网历史路单| 家百家乐破解软件| 阜南县| 澳门百家乐实战| 百家乐官网辅助工具| 网址百家乐的玩法技巧和规则 | 娱乐城开户送| 百家乐是否违法| 百家乐官网平玩法lm0| 多台百家乐的玩法技巧和规则| 88百家乐官网现金网| 全讯网纯净版| 百家乐翻天腾讯视频| 百家乐官网破解赌戏玩| 博彩现金网| 百家乐娱乐下载| 百家乐官网永利娱乐场开户注册| 开16个赌场敛财| 百家乐英皇娱乐场开户注册| 百家乐官网大赌场娱乐网规则 | 大发888出纳柜台| 做生意发财招财图像| 百家乐官网赌博规律| 联众博彩| 大发888容易赢吗| 澳门百家乐战法| 百家乐翻天qvod| 蓝盾百家乐官网赌城| 百家乐官网大赢家书籍| 爱赢娱乐城开户| 总统娱乐城返水| 棋牌小游戏下载| 15人百家乐桌| 澳门百家乐破解方法| 玩百家乐官网的好处|