吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一文讀懂CXL協議

e9Zb_gh_8734352 ? 來源:FPGA技術聯盟 ? 2023-02-11 11:01 ? 次閱讀

2001年,英特爾公布了第三代I/O技術——3GIO技術(后更名為PCI Express,即PCIe),以高性能、高擴展性、高可靠性及出色的兼容性取代了包括AGP和PCI在內所有的內部總線并且不斷升格。例如,2019年5月底公布的PCIe 5.0,其以32Gb/s的單通道帶寬與32GT/s(Giga Transmission per second)每通道數據傳輸速率,滿足了現今絕大多數的需求。但應對數據TB級增長、異構計算大行其道的當下,PCIe在內存使用效率、延遲和數據吞吐量等方面,已經面臨壓力。 二十年后,在如今這個數據爆炸式增長,異構計算大行其道的當下,曾經的“未來之星“PCI-e 已經開始出現后繼無人的現象,無法成為 CPUGPUFPGA 以及其他 AI 計算設備之間溝通的橋梁。為了達到最佳的計算效果,我們越來越期待一種以內存為中心的、富有變革性的新技術出現,基于PCI-e協議的CXL技術便在此環境下出世。 2019年,英特爾推出的CXL技術似乎殺出了重圍。短短幾年時間,CXL便成為業界公認的先進設備互聯標準,其最為強勁的競爭對手Gen-Z、OpenCAPI都紛紛退出了競爭,并將Gen-Z協議、OpenCAPI協議轉讓給CXL。

1、什么是CXL?

CXL全稱為Compute Express Link,作為一種全新的開放式互聯技術標準,其能夠讓CPU與GPU、FPGA或其他加速器之間實現高速高效的互聯,從而滿足高性能異構計算的要求,并且其維護CPU內存空間和連接設備內存之間的一致性。總體而言,其優勢高度概括在極高兼容性和內存一致性兩方面上。

2、CXL 協議

CXL 標準定義了 3 個協議,這些協議在通過標準 PCIe 5.0 PHY 以 32 GT/s 傳輸之前一起動態復用: CXL.io 協議本質上是經過一定改進的 PCIe 5.0 協議,用于初始化、鏈接、設備發現和列舉以及寄存器訪問。它為 I/O 設備提供了非一致的加載/存儲接口。 CXL.cache 協議定義了主機和設備之間的交互,允許連接的 CXL 設備使用請求和響應方法以極低的延遲高效地緩存主機內存。 CXL.mem 協議提供了主機處理器,可以使用加載和存儲命令訪問設備連接的內存,此時主機 CPU 充當主設備,CXL 設備充當從屬設備,并且可以支持易失性和持久性存儲器架構。 如圖 1 所示,CXL.cache 和 CXL.mem 合并且共享一個公共鏈路和事務層,而 CXL.io 有自己的鏈路和事務層。

db0d1a24-a927-11ed-bfe3-dac502259ad0.png

三個協議產生的數據都通過仲裁和多路復用 (ARB/MUX) 模塊一起動態復用,然后被移交到 PCIe 5.0 PHY,進而以 32GT/s 的速度進行傳輸。ARB/MUX 在 CXL 鏈路層(CXL.io 和 CXL.cache/mem)發出的請求之間進行仲裁,并根據仲裁結果復用數據,仲裁結果使用加權循環仲裁,權重由主機設置。ARB/MUX 還處理鏈路層發出的功耗狀態轉換請求,向物理層創建實現有序降耗操作的單個請求。

CXL 通過固定寬度的 528 位微片傳輸數據,該微片由四個 16 字節時隙組成,并添加了兩個字節 CRC:(4 x 16 + 2 = 66 字節= 528 位)。插槽采用多種格式定義,可專用于 CXL.cache 協議或 CXL.mem 協議。片頭定義了插槽格式,并攜帶允許事務層將數據正確路由到預期協議的信息

由于 CXL 使用 PCIe 5.0 PHY 和電氣元件,它可以有效地插入到任何可以通過 Flex Bus 使用 PCIe 5.0 的系統中。Flex Bus 是一個靈活的高速端口,可以靜態配置為支持 PCIe 或 CXL。圖 2 舉例顯示了 Flex Bus 鏈路。這種方法使 CXL 系統能夠利用 PCIe 重定時器;但是,目前 CXL 僅定義為直連 CPU 鏈路,因此無法利用 PCIe 交換機。隨著標準的逐步完善,交換功能可能會被添加到標準中;如果是這樣,則需要創建新的 CXL 交換機。

db20caec-a927-11ed-bfe3-dac502259ad0.png

3、CXL 設備類型

CXL.io 協議用于初始化和鏈接,所以必須獲得所有 CXL 設備的支持,如果 CXL.io 協議發生故障,鏈接就無法運行。其他兩個協議的不同組合產生了總共三種被定義并受 CXL 標準支持的獨特 CXL 設備類型。

圖 3 顯示了三種已定義的 CXL 設備類型及其相應的協議、典型應用以及支持的存儲器訪問類型。

db63e53e-a927-11ed-bfe3-dac502259ad0.png

對于 2 型設備,CXL 定義了兩個一致性“偏置”,用于控制 CXL 對主機和設備連接存儲器之間的一致性數據的處理方式。偏置模式指主機偏置和設備偏置,并且操作模式可以根據需要發生改變,從而在鏈路操作期間優化給定任務的性能。

2 型設備(例如,加速器)處理提交給主機的工作時間及其后續完成之間的數據時,設備偏置模式用于確保設備可以直接訪問其設備連接的存儲器,而無需與主機的一致性引擎通信。因此,設備可保證主機沒有緩存線路。這為設備提供了最優的延遲性能,使得設備偏置成為加速器執行工作的主要操作模式。主機處于設備偏置模式時,主機仍然可以訪問設備連接的存儲器,但性能卻不是最優。

主機偏置模式優先考慮從主機到設備連接存儲器的一致性訪問。該模式通常在工作提交期間使用,此時數據會從主機寫入設備連接的存儲器,而且在主機將數據從設備連接的存儲器中導出后,可使用該模式完成工作。在主機偏置模式下,設備連接的存儲器對于設備而言就像主機連接的存儲器一樣,如果設備需要訪問,就通過一條發送到主機的請求進行處理。

可以使用軟件或硬件,通過軟件輔助和硬件自治這兩種受支持的模式管理機制來控制偏置模式。加速器或其他 2 型設備可以選擇偏置模式,如果兩種模式均未選擇,則系統默認為主機偏置模式,這樣就必須通過主機路由對設備連接存儲器進行所有訪問。偏置模式可以使用 4KB 頁面的顆粒度進行更改,并通過 2 型設備中執行的偏置表進行跟蹤。

CXL 標準的一個重要特征是一致性協議是不對稱的。Home 緩存代理僅停留在主機中。因此,主機控制存儲器的緩存,從而解決連接的 CXL 設備請求的給定地址的整個系統的一致性問題。這完全不同于正在使用的現有專有和公開的一致性協議,特別是那些用于 CPU 到 CPU 連接的協議,因為它們通常是對稱的,會使得所有互連設備都變得對等。

雖然這樣有一些優點,但是對稱的高速緩存一致性協議更加復雜,并且所有設備都必須處理由此產生的復雜性。具有不同架構的設備可以采用不同的方法來實現在微架構級別優化的一致性,而這一情況可能會為實現廣泛的行業采用增加難度。通過使用主機控制的非對稱方法,可以將不同的 CPU 和加速器輕松納入新興 CXL 生態系統。

4、CXL的未來

可以設想在具有內存一致性的大型系統中同時使用多個協議來處理 CPU 到 CPU、CPU 到連接設備以及更長距離的機箱到機箱要求。目前,CXL 致力于為服務器提供經過優化的解決方案。CXL 固有的不對稱性意味著它可能不適用于 CPU 到 CPU 或加速器到加速器的連接。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10905

    瀏覽量

    213034
  • 協議
    +關注

    關注

    2

    文章

    606

    瀏覽量

    39344
  • 互聯技術
    +關注

    關注

    0

    文章

    13

    瀏覽量

    8367

原文標題:一文讀懂CXL協議

文章出處:【微信號:gh_873435264fd4,微信公眾號:FPGA技術聯盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    內存擴展CXL加速發展,繁榮AI存儲

    電子發燒友網報道(/黃晶晶)CXL即Compute Express Link,是種全新的互連協議,為各種處理器包括CPU、GPU、FPGA、加速器和存儲設備提供統
    的頭像 發表于 08-18 00:02 ?5029次閱讀
    內存擴展<b class='flag-5'>CXL</b>加速發展,繁榮AI存儲

    讀懂:LED 驅動電路二極管挑選要點

    讀懂:LED 驅動電路二極管挑選要點
    的頭像 發表于 02-06 14:47 ?69次閱讀

    讀懂什么是「雷電4」

    Thunderbolt讀懂什么是「雷電4」目前大部分PC接口配備了USB接口、音頻接口、HDMI接口等,這些接口的功能基本覆蓋了用戶的日常使用需求。為了提供更高速、更便捷的數據傳輸和設備連接體
    的頭像 發表于 02-05 17:52 ?93次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>什么是「雷電4」

    SMART Modular世邁科技CXL內存擴充卡獲CXL聯盟認證

    商名單。 這重要里程碑不僅標志著SMART Modular在CXL技術領域的領先地位,更是對其長期以來致力于高質量、高兼容性內存解決方案的肯定。CXL作為種高性能、低延遲的互連技術
    的頭像 發表于 02-05 15:59 ?86次閱讀

    瀾起科技CXL?內存擴展控制器芯片通過CXL 2.0合規性測試

    近日,瀾起科技在CXL(Compute Express Link)技術領域取得了又重要里程碑。其自主研發的CXL?內存擴展控制器(MXC)芯片成功通過了CXL 2.0合規性測試,并被
    的頭像 發表于 01-21 14:44 ?245次閱讀

    讀懂EAP認證協議:保障網絡安全的利器

    點擊藍字,關注我們 在當今數字化時代,網絡安全已成為人們關注的焦點。當我們連接Wi-Fi網絡時,如何確保網絡安全,防止未經授權的訪問呢?這就不得不提到EAP認證協議。今天,我們就來深入了解下EAP
    的頭像 發表于 01-08 15:40 ?240次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>EAP認證<b class='flag-5'>協議</b>:保障網絡安全的利器

    韓國無晶圓廠初創公司Panmnesia展示第個支持CXL的AI集群

    在2024?OCP全球峰會上,開發CXL交換機SoC和CXL IP的韓國無晶圓廠初創公司Panmnesia展示了第個支持CXL的AI集群,該集群采用
    的頭像 發表于 11-28 11:04 ?487次閱讀

    讀懂單燈控制器工作原理

    讀懂單燈控制器工作原理
    的頭像 發表于 11-11 13:13 ?403次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>單燈控制器工作原理

    讀懂MSA(測量系統分析)

    讀懂MSA(測量系統分析)
    的頭像 發表于 11-01 11:08 ?1104次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>MSA(測量系統分析)

    讀懂新能源汽車的功能安全

    電子發燒友網站提供《讀懂新能源汽車的功能安全.pdf》資料免費下載
    發表于 09-04 09:22 ?3次下載

    如何利用CXL協議實現高效能的計算架構

    構建個可橫向擴展的可組合分離架構。眾所周知,CXL協議涵蓋了type1、type2、type3三種設備類型,而目前學術界和工業界的研究主要集中在如何利用CXL技術擴展系統的內存容量。
    的頭像 發表于 09-03 09:14 ?758次閱讀
    如何利用<b class='flag-5'>CXL</b><b class='flag-5'>協議</b>實現高效能的計算架構

    打造異構計算新標桿!國數集聯發布首款CXL混合資源池參考設計

    參考設計是首個支持異構計算架構的CXL硬件設備,標志著CXL技術在數據中心領域迎來異構計算新階段。 ? 國數集聯基于FPGA與自主研發的CXL協議IP的先進特性,可實現CPU、GPU、
    的頭像 發表于 08-06 14:19 ?380次閱讀
    打造異構計算新標桿!國數集聯發布首款<b class='flag-5'>CXL</b>混合資源池參考設計

    國數集聯研發出首款CXL多級網絡交換機

    今日,全球頂級高速互聯芯片及解決方案設計專家——國數集聯公司,憑借自主研發的CXL(Compute Express Link)協議IP,引領行業前沿,成功研發出全球首款CXL多級網絡交換機(又名
    的頭像 發表于 07-31 13:04 ?695次閱讀

    電主軸:教您如何讀懂?|深圳恒興隆機電.

    電主軸:教您如何讀懂?|深圳恒興隆機電電主軸是種利用電機作為驅動源的主軸。它具有高速、高精度和高剛性等特點,廣泛應用于機械加工、數控機床、機器人等領域。本文將詳細介紹電主軸的原理
    發表于 03-27 10:30

    利用CXL技術重構基于RDMA的內存解耦合

    本文提出了種基于RDMA和CXL的新型低延遲、高可擴展性的內存解耦合系統Rcmp。其顯著特點是通過CXL提高了基于RDMA系統的性能,并利用RDMA克服了CXL的距離限制。
    發表于 02-29 10:05 ?3592次閱讀
    利用<b class='flag-5'>CXL</b>技術重構基于RDMA的內存解耦合
    百家乐官网ag厅投注限额| 百家乐的必赢术| 百利宫百家乐官网的玩法技巧和规则 | 六合彩现金网| 做生意摆放风水好吗| 德州扑克教学视频| 高尔夫百家乐官网的玩法技巧和规则| 威尼斯人娱乐场开户| 赌场百家乐官网试玩| 金杯百家乐的玩法技巧和规则| 百家乐官网公试打法| 百家乐高手论坛| 凯旋门百家乐官网游戏| 找查百家乐玩法技巧| 15人百家乐官网桌布| 长沙百家乐的玩法技巧和规则| 在线百家乐官网| 永利百家乐的玩法技巧和规则| 百家乐官网开户送10彩金| 威尼斯人娱乐网注册送38元彩金| 电玩城百家乐官网技巧| 大发888娱乐城下| 国美百家乐官网的玩法技巧和规则| 七匹狼娱乐城开户| 百家乐平台那家好| 淘金百家乐官网现金网| 时时博百家乐的玩法技巧和规则 | 海王星百家乐的玩法技巧和规则 | 皇室百家乐官网娱乐城| 百家乐筹码防伪套装| 万宝路百家乐官网的玩法技巧和规则| 百家乐de概率| 打百家乐官网的技巧| 大发888娱乐城 手机版| 风水上看做生意养金毛好吗| 搜索| 大发888亚洲游戏下载| 百家乐靠什么赢| 百家乐官网有技巧么| 大发888真人斗地主| 澳门百家乐如何算牌|