娱乐场所平面图怎么画,保单百家乐游戏机厂家,百家乐官网的关键技巧(中国)·官方网站

今天想跟大家一起學習下GPU之間是怎么通信互聯(lián)的。

自從GPU出現(xiàn)后，計算機愛好者和發(fā)燒友們就一直尋找新的方法來進一步提高系統(tǒng)GPU性能。

在單個GPU性能有限的情況下，將兩個或多個GPU連接起來這種在當時看起來非常荒謬的想法竟然漸漸成為提升系統(tǒng)GPU性能的主流方法。

特別是隨著游戲、圖形應用的發(fā)展，以及AI、HPC等新興應用的助推，多個GPU之間的互聯(lián)技術得到了快速迭代和發(fā)展，如今的GPU互聯(lián)已經(jīng)成為系統(tǒng)內(nèi)非常常見的一種技術。今天我們就來聊聊這些GPU互聯(lián)的那些技術。

第一個連接多個GPU解決方案：SLI

SLI，全稱為 " 可擴展的鏈接接口 "（ Scalable Link Interface），最早是由 3DFx Interactive 開發(fā)。

然而，3DFx Interactive這家公司在2000年破產(chǎn)，NVIDIA公司收購了這家公司并獲得了多GPU技術的權利。

于是，在2004年，NVIDIA首次推出了SLI技術版本，同時發(fā)布了GeForce 6800 Ultra GPU。該技術允許兩個GeForce 6800 Ultra GPU一起工作，以增強游戲時的圖形性能**。**因此，SLI技術迅速在游戲玩家和愛好者中流行起來。

SLI采用主從配置方式在系統(tǒng)中實現(xiàn)使用多個GPU，這種配置的重點是使用一個GPU作為主車，其他GPU作為從卡，SLI能夠同時連接4個GPU。

**SLI是第一個連接多個GPU的解決方案。**但是與所有技術一樣，SLI也有各種優(yōu)點和局限性。SLI配置必須選擇相同型號的兼容GPU。同時還需要分配一個單獨的PSU來滿足多個GPU的協(xié)調(diào)要求，導致GPU之間的通信延遲較高，且GPU之間的數(shù)據(jù)共享缺乏靈活性。

另外，NVIDIA大約在兩年前停止了對該技術的支持，為開發(fā)NVLink等新技術讓路。

SLI與CrossFire：多GPU解決方案之爭

雖然NVIDIA的SLI走在了多GPU互聯(lián)的前面，但也并非沒有競爭。

作為NVIDIA GPU市場上多年的老對手，AMD也推出了CrossFire這個技術來參與競爭。

與SLI技術類似，使用CrossFire技術時，用戶可選擇使用兩個或更多顯卡進行渲染，從而增加幀數(shù)和提高游戲運行效率。

CrossFire技術的一大優(yōu)點是用戶可以使用不同型號的AMD顯卡，從而節(jié)省成本。

然而，CrossFire也有其自身的優(yōu)勢和挑戰(zhàn)，CrossFire經(jīng)常因其軟件堆棧而受到批評，一些用戶發(fā)現(xiàn)該軟件堆棧不如NVIDIA SLI可靠且配置更復雜。

盡管存在這些差異，但這兩種技術都致力于實現(xiàn)相同的目標：增強游戲和消費者圖形體驗。它們在處理更高級、數(shù)據(jù)密集型任務方面的局限性最終將為 NVLink等下一代解決方案鋪平道路。

隨著2010年代的到來，計算領域開始發(fā)生巨大變化。人工智能 (AI)、高性能計算(HPC)和大數(shù)據(jù)分析的興起需要更強大的多GPU解決方案。很明顯，最初設計時考慮到游戲和消費者工作負載的SLI不足以滿足這些計算密集型任務。NVIDIA需要一個新的GPU互聯(lián)技術。

雙GPU卡：多GPU計算的獨特存在

雖然SLI和CrossFire等技術專注于連接多個獨立GPU，但還有另一種不太常見或者可以說是奇葩的多 GPU配置方法：雙GPU卡。

這些專用顯卡在單個PCB（印刷電路板）上安裝了兩個GPU核心，有效地充當單張卡上的SLI或CrossFire 設置。NVIDIA GeForce GTX 690和AMD Radeon HD 6990等卡是這種方法的流行示例。

雙GPU卡具有多種優(yōu)勢，他們通過將兩個GPU壓縮到一個卡槽中來節(jié)省空間，這使得它們對小型PC很有吸引力。同時他們還無需將單獨的卡與外部連接器連接起來，從而簡化了設置。

然而，這些雙GPU卡散熱是一個重大問題，可以說每一個卡都是一個**"小火爐"****。**通常這種配置方式需要先進的冷卻解決方案。同時功耗也很高，需要強大的電源來提供穩(wěn)定的電流。

雙GPU卡的方式看起來是一種"兩全其美"的解決方案，將多GPU設置的原始功能與單卡的簡單性結合在一起。然而，由于其高成本和相關的技術挑戰(zhàn)，雙GPU卡經(jīng)常被視為雞肋產(chǎn)品。

隨著NVLink等多GPU技術不斷發(fā)展以提供更高的帶寬和更低的延遲，對雙 GPU卡的需求已經(jīng)減少。盡管如此，它仍然是GPU發(fā)展史上一個獨特的存在。

****** NVLink 的誕生******

NVLink是2017年隨NVIDIA Volta架構推出的技術。這項技術不僅僅是SLI技術的升級，而且是對GPU如何互連的根本性重新思考。

NVLink提供了更高的帶寬（最新版本高達900 GB/s）、更低的延遲以及允許GPU之間更復雜和大量互連的網(wǎng)狀拓撲。此外，NVLink引入了統(tǒng)一內(nèi)存的概念，支持連接的 GPU 之間的內(nèi)存池，這對于需要大型數(shù)據(jù)集的任務來說是一個至關重要的功能。

SLI與NVLink有何區(qū)別？

乍一看，人們可能會認為NVLink是SLI的簡單升級，但這過于武斷了。雖然這兩種技術都旨在連接多個GPU，但NVLink的設計考慮了不同的受眾。它專為科學研究、數(shù)據(jù)分析，尤其是人工智能和機器學習應用而設計。更高的帶寬、更低的延遲和統(tǒng)一的內(nèi)存使NVLink成為應對當今計算挑戰(zhàn)的更加靈活和強大的解決方案。

雖然NVLink和SLI兩者均由Nvidia開發(fā)，但存在一些差異。S****LI按照主從關系原理運行，而NVLink通過網(wǎng)狀網(wǎng)絡運行。結果，SLI中形成了NVLink中不存在的數(shù)據(jù)瓶頸。

采用網(wǎng)狀網(wǎng)絡開發(fā)的并行連接可增強GPU的性能。因此，多個GPU作為一個單元，有助于提供增強的處理能力。連接的GPU擁有自己的內(nèi)存，從而增加了系統(tǒng)的總可用內(nèi)存。NVLink橋還支持20至30 GB/s 的帶寬，為4個GPU 的設置提供超過100GB/s 的速度。

網(wǎng)狀網(wǎng)絡消除 GPU之間的層級關系。計算數(shù)據(jù)因此連接到每個GPU的節(jié)點，從而提高了整體渲染速度。因此，150至200GB/s的帶寬也可以實現(xiàn)。與SLI 相比，NVLink的延遲非常低。

****** NVLink的技術原理******

NVLink代表了多GPU互聯(lián)技術的邏輯演變，不僅在速度方面，而且在架構設計方面。NVLink的結構由可以雙向傳輸數(shù)據(jù)的高速數(shù)據(jù)通道組成。與傳統(tǒng)的基于總線的系統(tǒng)不同，NVLink采用點對點連接，有效減少瓶頸并提高數(shù)據(jù)吞吐量。最新的迭代提供高達900GB/s的帶寬，比SLI的功能有了顯著增強。

NVLink與眾不同的關鍵功能之一是它支持網(wǎng)狀拓撲的能力。與舊技術的菊花鏈或中心輻射型拓撲相比，網(wǎng)格設置允許GPU之間實現(xiàn)更通用且數(shù)量更多的連接。這在數(shù)據(jù)中心和高性能計算應用程序中特別有用，在這些應用程序中，復雜的數(shù)據(jù)路由是常態(tài)。

統(tǒng)一內(nèi)存是NVLink的另一個特點。這允許GPU共享公共內(nèi)存池，從而實現(xiàn)更高效的數(shù)據(jù)共享并減少在GPU之間復制數(shù)據(jù)的需要。這對于機器學習和大數(shù)據(jù)分析等應用程序來說是一個巨大的推動，在這些應用程序中，大型數(shù)據(jù)集通常超過單個GPU的內(nèi)存容量。

NVLink還改善了延遲，這是任何高性能計算設置中的一個關鍵因素。較低的延遲可確保GPU之間更快的數(shù)據(jù)傳輸和同步，從而實現(xiàn)更高效的并行計算。這是通過NVLink的直接內(nèi)存訪問 (DMA) 功能實現(xiàn)的，允許GPU直接讀寫彼此的內(nèi)存，而不需要CPU的參與。

NVlink的影響

鑒于人工智能在現(xiàn)代計算中的重要性日益增加，NVLink的優(yōu)勢不僅是漸進式的，而且是變革性的。在AI模型訓練和數(shù)據(jù)創(chuàng)建中，NVLink可實現(xiàn)GPU之間更快的數(shù)據(jù)傳輸，從而實現(xiàn)更高效的并行處理。這在處理大型訓練數(shù)據(jù)集時尤其有用，這是一個與人工智能模型訓練數(shù)據(jù)創(chuàng)建的新興領域密切相關的主題。

隨著量子模擬、實時分析和下一代人工智能算法等先進計算的需求不斷增長，我們可以期待NVLink的功能進一步增強。無論是帶寬的增加還是促進GPU之間更好合作的新功能，NVLink或其后繼者無疑仍將是滿足未來計算需求的核心。

從SLI到NVLink的過渡是多GPU技術的一個重要里程碑，它反映了NVIDIA 對創(chuàng)新的承諾以及對不斷變化的計算環(huán)境的敏銳理解。從游戲到人工智能，從消費應用程序到數(shù)據(jù)中心，NVLink和SLI的發(fā)展歷程說明了需求對孕育創(chuàng)新、推動技術發(fā)展的重要價值。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5076

瀏覽量
103720
gpu

gpu

+關注

關注
28

文章
4774

瀏覽量
129353
HPC

HPC

+關注

關注
0

文章
324

瀏覽量
23853
PSU

PSU

+關注

關注
0

文章
43

瀏覽量
11924

原文標題：一文讀懂：多卡GPU是如何互聯(lián)通信的？

文章出處：【微信號：SDNLAB，微信公眾號：SDNLAB】歡迎添加關注！文章轉載請注明出處。

將兩片TLK3101之間用光收發(fā)模塊通過光纖互聯(lián)，TLK3101和光收發(fā)模塊之間的接口匹配不存在問題，為什么？

我們將兩片 TLK 3101之間用光收發(fā)模塊通過光纖互聯(lián)，TLK 3101和光收發(fā)模塊之間的接口匹配不存在問題，光功率都在正常的范圍之內(nèi) ，但在實驗室測試中經(jīng)常出現(xiàn)TLK 3101幀同步丟失

發(fā)表于 02-05 07:22

設備之間的互聯(lián)互通解決方案

實現(xiàn)物聯(lián)網(wǎng)的廣泛應用，需要解決設備之間的互聯(lián)互通問題。由于不同的設備和傳感器使用不同的通信協(xié)議和接口，因此需要一個中間設備來實現(xiàn)不同設備之間的通信

發(fā)表于 01-24 16:31 ?112次閱讀

高速ADC、DAC與處理器之間是怎么通信的呢？

一般低速的ADC、DAC通過串行通信接口，比如SPI與處理器/DSP通信，但高速ADC、DAC與處理器之間是怎么通信的呢

發(fā)表于 01-10 08:30

GPU加速云服務器怎么用的

GPU加速云服務器是將GPU硬件與云計算服務相結合，通過云服務提供商的平臺，用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機實例。那么，GPU加速云服務器怎么用的

發(fā)表于 12-26 11:58 ?129次閱讀

常見GPU問題及解決方法

各種問題。以下是一些常見的GPU問題及其解決方法： GPU驅動程序過時或不兼容問題描述：GPU驅動程序是GPU與操作系統(tǒng)之間的橋梁，負責將

發(fā)表于 10-27 14:12 ?1940次閱讀

GPU算力租用平臺是什么

GPU算力租用平臺是一種基于云計算的服務模式，它允許用戶通過互聯(lián)網(wǎng)按需租用高性能GPU資源，而無需自行購買、部署和維護這些硬件。

發(fā)表于 10-16 10:15 ?304次閱讀

數(shù)字信號處理與通信原理之間的關系

數(shù)字信號處理（Digital Signal Processing，簡稱DSP）和通信原理是信息科學領域中兩個密切相關的領域。它們在理論和應用層面都有很多相互聯(lián)系和相互依賴的地方。在現(xiàn)代通信系統(tǒng)中

發(fā)表于 08-09 09:35 ?1126次閱讀

暴漲預警！NVIDIA GPU供應大跳水

gpu

jf_02331860
發(fā)布于 :2024年07月26日 09:41:42

為什么GPU對AI如此重要？

GPU在人工智能中相當于稀土金屬，甚至黃金，它們在當今生成式人工智能時代中的作用不可或缺。那么，為什么GPU在人工智能發(fā)展中如此重要呢？什么是GPU圖形處理器（

發(fā)表于 05-17 08:27 ?796次閱讀

常見的PLC通信指令有哪些呢？

PLC的通信指令用于實現(xiàn)PLC與其他設備或系統(tǒng)之間的數(shù)據(jù)交換。

發(fā)表于 05-10 11:01 ?2934次閱讀

NVLink的演進：從內(nèi)部互聯(lián)到超級網(wǎng)絡

NVLink是NVIDIA開發(fā)的一種高速、低延遲的互聯(lián)技術，旨在連接多個GPU以實現(xiàn)高性能并行計算。與傳統(tǒng)的PCIe總線相比，NVLink提供了更高的帶寬和更低的延遲，使得GPU之間可

發(fā)表于 04-13 11:22 ?1232次閱讀

深入探討常見的GPU系統(tǒng)架構

同一主機內(nèi)GPU之間的通信：通過NVLink技術，雙向帶寬達到600GB/s，單向帶寬達到300GB/s。

發(fā)表于 04-07 11:35 ?2243次閱讀

IPv6是互聯(lián)網(wǎng)通信的未來

在當今數(shù)字化時代，互聯(lián)網(wǎng)已成為我們?nèi)粘Ｉ钪胁豢苫蛉钡囊徊糠郑S著智能設備的興起，需要更多的IP地址。目前用于互聯(lián)網(wǎng)通信的協(xié)議是IPv4，但IPv4的可用地址已經(jīng)耗盡，這就是為什么新的協(xié)議IPv6被

發(fā)表于 03-29 14:17 ?520次閱讀

NVLink技術之GPU與GPU的通信

在多 GPU 系統(tǒng)內(nèi)部，GPU 間通信的帶寬通常在數(shù)百GB/s以上，PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸，且PCIe鏈路接口的串并轉換會產(chǎn)生較大延時，影響GPU并行計算的效率和性能。

發(fā)表于 03-27 09:40 ?4229次閱讀

如何排查FPGA與USB之間的芯片通信問題？

”，而在SBBulkSourceSink固件中沒有顯示這個錯誤，可不可以證明我的FPGA和USB之間通信成功？另外，我該如何排查FPGA與USB之間的芯片通信問題？

發(fā)表于 02-27 06:46