吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)NVIDIA為何可以在高性能計(jì)算GPU中處于不敗地位?

GPU視覺識(shí)別 ? 來源:GPU視覺識(shí)別 ? 作者:GPU視覺識(shí)別 ? 2022-09-22 10:59 ? 次閱讀

poYBAGMrz52ALhY5AAAcCLdNAvA618.png

英偉達(dá) | GTC2022| 高性能計(jì)算

NVIDIA | RTX4090 |液冷服務(wù)器

在東數(shù)西算、生命科學(xué)、遙感測(cè)繪、地質(zhì)勘探、真空羽流、冷凍電鏡等技術(shù)的快速發(fā)展下,高性能計(jì)算的發(fā)展逐漸被人們所重視。GTC 2022會(huì)上指出高性能計(jì)算是推動(dòng)科學(xué)發(fā)展的關(guān)鍵工具之一。

昨天GeForce RTX 4090顯卡正式公布,是全新GeForce RTX 40系列的旗艦產(chǎn)品,也是全球首款基于全新NVIDIA Ada Lovelace架構(gòu)。與上一代采用DLSS 2的RTX 3090 Ti相比,采用DLSS 3的RTX 4090的性能提升可達(dá)4倍。RTX 4090具有760億個(gè)晶體管、16384個(gè)CUDA 核心和 24GB 高速美光 GDDR6X 顯存。

本文將從英偉達(dá)為何在高性能計(jì)算中處于不敗地位、高性能計(jì)算發(fā)展趨勢(shì)、以及高性能計(jì)算解決方案為大家解讀。

pYYBAGMrz56AEpewAADVEMLpZb0223.jpg

高端GPU

英偉達(dá)獨(dú)角戲?

作為通用計(jì)算的“加速神器”--——高端GPU正在成為大型數(shù)據(jù)中心人工智能、超算等領(lǐng)域的剛需。英偉達(dá)在高端GPU市場(chǎng)長(zhǎng)期占據(jù)主導(dǎo)地位,市場(chǎng)份額一度超過90%。目前國(guó)內(nèi)企業(yè)要突破英偉達(dá)等國(guó)外公司的壟斷還有很長(zhǎng)的路要走。而國(guó)內(nèi)基于架構(gòu)創(chuàng)新的DSA(針對(duì)特定領(lǐng)域的可編程處理器芯片產(chǎn)品日益豐富,可能會(huì)帶來一些曙光。

高端GPU與傳統(tǒng)GPU“涇渭分明”

傳統(tǒng)GPU聚焦圖像學(xué),關(guān)注幀數(shù)、渲染逼真度、對(duì)于真實(shí)場(chǎng)景的映射程度等指標(biāo),主要用于運(yùn)行游戲、專業(yè)圖像處理、加密貨幣處理等場(chǎng)景。而高端GPU是用于計(jì)算加速的芯片產(chǎn)品,專注于基礎(chǔ)科學(xué)等超算領(lǐng)域和訓(xùn)練、推理等大規(guī)模人工智能計(jì)算場(chǎng)景。

衡量高端GPU的主要維度是通用性、易用性和高性能。通用硬件架構(gòu)應(yīng)該足夠靈活,以適應(yīng)人工智能的迭代算法和場(chǎng)景。易用性是指開發(fā)門檻更低,開發(fā)者更容易上手,結(jié)合實(shí)際場(chǎng)景進(jìn)行定制化開發(fā)。高性能是指芯片產(chǎn)品的基本性能和性價(jià)比必須達(dá)到國(guó)際先進(jìn)水平,才能進(jìn)行市場(chǎng)開拓。

2022年第二季度獨(dú)立GPU市場(chǎng)(包括AIB 合作伙伴顯卡)份額

poYBAGMrz56AGPnTAARw_1REqpc343.png

來源:Jon Peddie Research

算力往往是市場(chǎng)對(duì)GPU性能優(yōu)劣的“第一印象”。但高端GPU的性能不等于紙面性能,尤其不能用單一性能的紙面數(shù)據(jù)來衡量。

在實(shí)際使用的過程中,GPU的通用性、易用性、實(shí)際性的重要程度遠(yuǎn)大于紙面標(biāo)出的算力這一單一性能。紙面指標(biāo)標(biāo)得再高,也要關(guān)注內(nèi)存和帶寬夠不夠,以及芯片之間的互聯(lián)等問題解決得好不好。用單一性能來衡量GPU是否高端,是一個(gè)常見的誤區(qū)。

高性能計(jì)算將是主要“競(jìng)技場(chǎng)”

長(zhǎng)期以來,英偉達(dá)一直主導(dǎo)著高端GPU市場(chǎng),市場(chǎng)份額超過90%,尤其是在人工智能計(jì)算領(lǐng)域。到目前為止,英偉達(dá)已經(jīng)推出Volta、Ampere、Hopper等用于高性能計(jì)算和AI訓(xùn)練的架構(gòu),并在此基礎(chǔ)上推出了V100、A100、H100等高端GPU。面向向量的雙精度浮點(diǎn)運(yùn)算能力從7.8 TFLOPS一路走到30 TFLOPS。

作為全球第二大獨(dú)立GPU供應(yīng)商,AMD雖在高端GPU的整體份額與英偉達(dá)存在差距,但在超算領(lǐng)域闖出了一片天。在最新全球超級(jí)計(jì)算機(jī)TOP500榜單上,世界上最快的超級(jí)計(jì)算機(jī)橡樹嶺國(guó)家實(shí)驗(yàn)室(ORNL)前沿、世界排名第三的超級(jí)計(jì)算機(jī)LUMI,都采用了AMD EPYC處理器和AMD Instinct MI250X GPU加速器。

AMD在超算領(lǐng)域的亮眼表現(xiàn),是建立在針對(duì)性的軟硬件設(shè)計(jì)上,基于CDNA 2架構(gòu)的GPU加速器、ROCm軟件平臺(tái)與開源應(yīng)用程序資源中心AMD Infinity Hub的組合,構(gòu)成了對(duì)于科研人員更加友好的硬件性能和編程環(huán)境。

雖然直接使用GPU進(jìn)行高性能或AI計(jì)算更方便,但上層應(yīng)用降本增效的核心需求對(duì)底層算力提出了更高的要求。國(guó)外AI創(chuàng)業(yè)公司推出的AI芯片往往基于一種新的架構(gòu),全面提升并側(cè)重優(yōu)化并行計(jì)算能力。國(guó)內(nèi)領(lǐng)先的AI芯片公司也出于同樣的考慮,推出了一系列基于DSA架構(gòu)的人工智能計(jì)算芯片。

在國(guó)內(nèi)市場(chǎng),基于架構(gòu)創(chuàng)新的DSA芯片產(chǎn)品日益豐富。如華為自研的面向AI計(jì)算的架構(gòu)特色達(dá)芬奇,昆侖芯科技推出的第一代架構(gòu)XPU-K和第二代架構(gòu)XPU-R,燧原科技的自研架構(gòu)GCU-CARA等,都已經(jīng)進(jìn)入規(guī)模落地階段。隨著AI計(jì)算的應(yīng)用場(chǎng)景越來越細(xì)分和復(fù)雜,定制化和異構(gòu)化DSA有望在下一代計(jì)算平臺(tái)中發(fā)揮更大的作用。

新應(yīng)用領(lǐng)域?qū)映霾桓F

全球?yàn)?zāi)難性氣候事件正在不斷增加,提前預(yù)測(cè)此類事件對(duì)保護(hù)人類安全越來越重要,因此未來一年與氣候預(yù)測(cè)相關(guān)的應(yīng)用程序?qū)⒃贖PC領(lǐng)域備受關(guān)注。此外,隨著HPC在云端的使用,將有更多HPC應(yīng)用于消費(fèi)導(dǎo)向的軟件程序開發(fā),虛擬世界和元宇宙概念的出現(xiàn),也讓HPC迎來新的發(fā)展機(jī)遇,既可用于游戲(AR/VR)等娛樂應(yīng)用,也可用于數(shù)字孿生等模擬應(yīng)用。

HPC市場(chǎng)正在擴(kuò)展新的領(lǐng)域,在傳統(tǒng)的模擬和建模過程中加入人工智能(AI)和數(shù)據(jù)分析技術(shù)。新冠疫情的爆發(fā)增加了對(duì)靈活、可擴(kuò)展的云端HPC解決方案的需求,這一需求連同各個(gè)垂直行業(yè)(生命科學(xué)、汽車、金融、游戲、制造業(yè)、航空航天等)對(duì)快速處理數(shù)據(jù)和高精度日益增長(zhǎng)的需求,將會(huì)是未來幾年推動(dòng)HPC應(yīng)用增長(zhǎng)的主要因素。AI、邊緣計(jì)算、5G等技術(shù)將拓寬HPC的功能,從而形成新的芯片/系統(tǒng)架構(gòu),為各個(gè)行業(yè)提供高效處理和分析能力。

提高HPC安全性將成為關(guān)鍵

當(dāng)市場(chǎng)整體的數(shù)字化程度提升,則安全風(fēng)險(xiǎn)也將隨之增加。越來越多的高性能計(jì)算正在遠(yuǎn)離數(shù)據(jù)中心,將直接導(dǎo)致無法通過軟件補(bǔ)丁處理的攻擊數(shù)量增加。這給開發(fā)團(tuán)隊(duì)帶來巨大壓力,迫使他們緊急推出硬件來解決這些問題,由此縮短硬件設(shè)計(jì)周期。因此提高開發(fā)者的生產(chǎn)效率以緊跟上市需求的步伐將成為下一步布局重點(diǎn)。

HPC處理器架構(gòu)多樣化

隨著數(shù)據(jù)量增加,不僅是安全性,基礎(chǔ)設(shè)施存儲(chǔ)以及數(shù)據(jù)處理的計(jì)算能力必須得到提升。此外,新的架構(gòu)包括芯片間的連接也是推動(dòng)新需求所必需的。

受到不斷變化的AI工作負(fù)載、靈活的計(jì)算(CPU、GPU、FPGA、DPU等)、成本、內(nèi)存和IO吞吐量等因素共同驅(qū)動(dòng),HPC架構(gòu)正在經(jīng)歷巨變。微架構(gòu)層面變得互連更快、計(jì)算密度更高存儲(chǔ)可拓展、基礎(chǔ)設(shè)施效率更高、生態(tài)友好性、空間管理和安全性更高。從系統(tǒng)的角度來看,下一代HPC架構(gòu)將出現(xiàn)分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長(zhǎng),不同的專用處理架構(gòu)將集成在單個(gè)節(jié)點(diǎn)中,在模塊之間實(shí)現(xiàn)精密、靈活的切換。如此復(fù)雜的系統(tǒng)也帶來了巨大的驗(yàn)證挑戰(zhàn),尤其是系統(tǒng)的IP或節(jié)點(diǎn)、軟硬件動(dòng)態(tài)協(xié)調(diào)、基于工作負(fù)載的性能、電源等相關(guān)驗(yàn)證。要滿足這些驗(yàn)證需求,需要開發(fā)新的軟硬件驗(yàn)證方法。

移動(dòng)數(shù)據(jù)對(duì)電力和時(shí)間有很大的需求,這是系統(tǒng)管理者現(xiàn)在面臨的挑戰(zhàn)之一,減少數(shù)據(jù)移動(dòng)量將成為未來的一種趨勢(shì)。我們需要繼續(xù)擴(kuò)展資源,利用高級(jí)封裝和芯片間接口來支持更高性能的設(shè)備,即通過使用多裸晶來擴(kuò)展設(shè)備內(nèi)的處理能力,這在未來一年內(nèi)有望真正實(shí)現(xiàn)。

poYBAGMrz6CAUKPpAAScOc4XcCU538.png

高性能計(jì)算

液冷解決方案

深度學(xué)習(xí)、視覺計(jì)算、圖像渲染、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)的迅猛發(fā)展的大背景下,高性能計(jì)算HPC、液冷散熱已經(jīng)不再是少數(shù)大公司或大型科研機(jī)構(gòu)的專屬要求,而是被越來越多的包括政府、教育科研、遙感測(cè)繪、醫(yī)藥研發(fā)、小分子研究、細(xì)胞治療、圖像識(shí)別的客戶所需要和接受。

藍(lán)海大腦為滿足客戶需求,結(jié)合行業(yè)特點(diǎn)從計(jì)算節(jié)點(diǎn)、網(wǎng)絡(luò)、存儲(chǔ)、功耗、擴(kuò)展、散熱等方面出發(fā),提出完善的解決方案。

poYBAGMrz6GAF0a-AAJ685oF3pk841.png

產(chǎn)品特性

機(jī)架式液冷設(shè)計(jì),即插即用,快速輕松投入使用;

支持最多9塊GPU圖形卡和2顆CPU處理器;

機(jī)架的存儲(chǔ)空間可大大擴(kuò)展,可用于云存儲(chǔ)服務(wù);

液冷系統(tǒng)密度更高、更節(jié)能、防噪音效果更好;

高效節(jié)能、綠色環(huán)保

客戶收益

超融合架構(gòu)承擔(dān)著計(jì)算資源池和分布式存儲(chǔ)資源池的作用,極大地簡(jiǎn)化了數(shù)據(jù)中心的基礎(chǔ)架構(gòu),通過軟件定義的計(jì)算資源虛擬化和分布式存儲(chǔ)架構(gòu)實(shí)現(xiàn)無單點(diǎn)故障、無單點(diǎn)瓶頸、彈性擴(kuò)展、性能線性增長(zhǎng)等能力。

通過簡(jiǎn)單方便的統(tǒng)一管理界面,實(shí)現(xiàn)對(duì)數(shù)據(jù)中心計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、虛擬化等資源的統(tǒng)一監(jiān)控、管理和運(yùn)維。

超融合基礎(chǔ)架構(gòu)形成的計(jì)算資源池和存儲(chǔ)資源池直接可以被云計(jì)算平臺(tái)進(jìn)行調(diào)配,服務(wù)于OpenStack、EDP、Docker、Hadoop、R、HPC等IaaS、PaaS、SaaS平臺(tái),對(duì)上層的應(yīng)用系統(tǒng)或應(yīng)用集群等進(jìn)行支撐。

分布式存儲(chǔ)架構(gòu)簡(jiǎn)化容災(zāi)方式,實(shí)現(xiàn)同城數(shù)據(jù)雙活和異地容災(zāi)。現(xiàn)有的超融合基礎(chǔ)架構(gòu)可以延伸到公有云,可以輕松將私有云業(yè)務(wù)遷到公有云服務(wù)。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103723
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4775

    瀏覽量

    129357
  • 高性能計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    13440
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開發(fā)和設(shè)計(jì)迭代,縮短開發(fā)周期,提升產(chǎn)
    的頭像 發(fā)表于 12-27 16:24 ?233次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問題,但會(huì)降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些
    發(fā)表于 12-16 14:25

    軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU

    軟銀公司宣布,其正在擴(kuò)展的日本頂級(jí)人工智能計(jì)算平臺(tái)已安裝了約4000顆英偉達(dá)Hopper GPU。這一舉措顯著提升了平臺(tái)的計(jì)算能力。據(jù)悉,該
    的頭像 發(fā)表于 11-04 16:18 ?492次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    應(yīng)用上具有獨(dú)特優(yōu)勢(shì)和技術(shù)特點(diǎn),英偉達(dá)GPU上具有技術(shù)引領(lǐng)優(yōu)勢(shì)。這部分也是比較理論框架化些,通過閱讀可以對(duì)
    發(fā)表于 11-03 12:55

    英偉達(dá)Blackwell GPU未來一年訂單爆滿

    據(jù)摩根士丹利(大摩)透露,人工智能(AI)芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)NVIDIA)的管理層近期的一系列與投資人的會(huì)議,分享了關(guān)于其下一代
    的頭像 發(fā)表于 10-17 16:52 ?571次閱讀

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件AMD GPU上的無縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件AMD GPU上的無縫遷
    的頭像 發(fā)表于 07-18 14:40 ?713次閱讀

    NVIDIA突破美國(guó)禁令,將在中東部署其高性能AI/HPC GPU加速卡

    Ooredoo達(dá)成合作協(xié)議,將在中東地區(qū)部署其高性能AI/HPC GPU加速卡。這一舉動(dòng)不僅標(biāo)志著NVIDIA中東市場(chǎng)的戰(zhàn)略布局取得了重大突破,也引發(fā)了外界對(duì)于如何防止這些先進(jìn)技術(shù)流
    的頭像 發(fā)表于 06-24 14:47 ?910次閱讀

    英偉達(dá)數(shù)據(jù)中心GPU出貨量飆升,市場(chǎng)份額持續(xù)領(lǐng)跑

    全球半導(dǎo)體和計(jì)算技術(shù)不斷革新的浪潮英偉達(dá)NVIDIA)再次憑借其卓越的技術(shù)實(shí)力和市場(chǎng)洞察
    的頭像 發(fā)表于 06-13 17:08 ?1252次閱讀

    英偉達(dá)GPU新品規(guī)劃與HBM市場(chǎng)展望

    COMPUTEX 2024主題演講英偉達(dá)NVIDIA)公布了其GPU產(chǎn)品的未來規(guī)劃。據(jù)
    的頭像 發(fā)表于 06-13 09:44 ?889次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    新的標(biāo)準(zhǔn)。Blackwell架構(gòu)和GB200 超級(jí)芯片有望推動(dòng)英偉達(dá)人工智能領(lǐng)域更進(jìn)一步,鞏固其高性能
    發(fā)表于 05-13 17:16

    英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU的市場(chǎng)規(guī)模全球范圍內(nèi)持續(xù)提升。目前,GPU市場(chǎng)主要由英偉達(dá)、AMD和英特爾
    的頭像 發(fā)表于 05-10 00:59 ?5579次閱讀

    國(guó)內(nèi)GPU新勢(shì)力:能否成為英偉達(dá)的“終結(jié)者”?

    在當(dāng)今的信息技術(shù)時(shí)代,圖形處理器(GPU)和人工智能(AI)加速卡在計(jì)算領(lǐng)域中扮演著至關(guān)重要的角色。英偉達(dá)NVIDIA),作為全球
    的頭像 發(fā)表于 04-24 11:07 ?544次閱讀
    國(guó)內(nèi)<b class='flag-5'>GPU</b>新勢(shì)力:能否成為<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>的“終結(jié)者”?

    FPGA深度學(xué)習(xí)應(yīng)用或?qū)⑷〈?b class='flag-5'>GPU

    ,也正積極的為其開發(fā)專用的 AI 硬件,用于自己的云產(chǎn)品和邊緣計(jì)算產(chǎn)品環(huán)境。 神經(jīng)形態(tài)芯片 方面也有著一些發(fā)展,這是一種專門為神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的計(jì)算機(jī)架構(gòu)。英特爾神經(jīng)形態(tài)
    發(fā)表于 03-21 15:19

    英偉達(dá)H200性能怎么樣

    英偉達(dá)H200性能卓越,集成了高性能CPU和GPU,通過高速NVLink連接,消除了傳統(tǒng)計(jì)算瓶頸
    的頭像 發(fā)表于 03-07 16:39 ?1142次閱讀

    英偉達(dá)是干什么的?

    英偉達(dá)NVIDIA)是一家全球知名的圖形處理器(GPU)和人工智能(AI)技術(shù)公司,專門打造面向計(jì)算機(jī)、消費(fèi)電子和移動(dòng)終端,能夠改變整個(gè)行
    的頭像 發(fā)表于 03-01 16:41 ?6873次閱讀
    百家乐官网平注常赢规则| 皇冠网百家乐官网平台| 百家乐筹码套装| 什么是百家乐官网平注法| 大发888下载亚洲城| 原阳县| 百家乐赌场娱乐网规则| 职业赌百家乐官网技巧 | 金城百家乐玩法| 八大胜百家乐官网现金网| 大发888娱乐鸿博娱乐| 百家乐赢足球博彩皇冠| 百家乐官网投注程式| 欢乐谷娱乐城信誉| 百家乐买对子技巧| 澳门百家乐官网如何算| 井研县| 大发888官方下载删除| 百家乐游戏程序出售| 百家乐官网破解软件真的有用吗| 太阳城娱乐城下载| 百家乐路单| 在线百家乐官网策略| 百家乐官网真人娱乐注册| 大发888娱乐城 真钱| 百家乐投注网址| 鸟巢百家乐官网的玩法技巧和规则| 百家乐官网视频麻将| 大发888娱乐城动态| 百家乐一般多大码| 免费百家乐奥秘| 金域百家乐官网娱乐城| 御匾会娱乐城| 东方太阳城嘉宾国际酒店| 金赞百家乐娱乐城| 百家乐官网赌场论坛博客| 百家乐官网登封代理| 德州扑克在线| 百家乐怎样下注| 澳门百家乐实战| 百家乐官网游戏种类|