德州扑克世界比赛,516棋牌怎么样宁静的夜晚我还是没有睡意 ,卡塔尔世界杯赛程看点(中国)·官方网站

英偉達(dá) | GTC2022| 高性能計(jì)算

NVIDIA | RTX4090 |液冷服務(wù)器

在東數(shù)西算、生命科學(xué)、遙感測(cè)繪、地質(zhì)勘探、真空羽流、冷凍電鏡等技術(shù)的快速發(fā)展下，高性能計(jì)算的發(fā)展逐漸被人們所重視。GTC 2022會(huì)上指出高性能計(jì)算是推動(dòng)科學(xué)發(fā)展的關(guān)鍵工具之一。

昨天GeForce RTX 4090顯卡正式公布，是全新GeForce RTX 40系列的旗艦產(chǎn)品，也是全球首款基于全新NVIDIA Ada Lovelace架構(gòu)。與上一代采用DLSS 2的RTX 3090 Ti相比，采用DLSS 3的RTX 4090的性能提升可達(dá)4倍。RTX 4090具有760億個(gè)晶體管、16384個(gè)CUDA 核心和 24GB 高速美光 GDDR6X 顯存。

本文將從英偉達(dá)為何在高性能計(jì)算中處于不敗地位、高性能計(jì)算發(fā)展趨勢(shì)、以及高性能計(jì)算解決方案為大家解讀。

高端GPU

英偉達(dá)獨(dú)角戲？

作為通用計(jì)算的“加速神器”--——高端GPU正在成為大型數(shù)據(jù)中心、人工智能、超算等領(lǐng)域的剛需。英偉達(dá)在高端GPU市場(chǎng)長(zhǎng)期占據(jù)主導(dǎo)地位，市場(chǎng)份額一度超過90%。目前國(guó)內(nèi)企業(yè)要突破英偉達(dá)等國(guó)外公司的壟斷還有很長(zhǎng)的路要走。而國(guó)內(nèi)基于架構(gòu)創(chuàng)新的DSA（針對(duì)特定領(lǐng)域的可編程處理器）芯片產(chǎn)品日益豐富，可能會(huì)帶來一些曙光。

高端GPU與傳統(tǒng)GPU“涇渭分明”

傳統(tǒng)GPU聚焦圖像學(xué)，關(guān)注幀數(shù)、渲染逼真度、對(duì)于真實(shí)場(chǎng)景的映射程度等指標(biāo)，主要用于運(yùn)行游戲、專業(yè)圖像處理、加密貨幣處理等場(chǎng)景。而高端GPU是用于計(jì)算加速的芯片產(chǎn)品，專注于基礎(chǔ)科學(xué)等超算領(lǐng)域和訓(xùn)練、推理等大規(guī)模人工智能計(jì)算場(chǎng)景。

衡量高端GPU的主要維度是通用性、易用性和高性能。通用硬件架構(gòu)應(yīng)該足夠靈活，以適應(yīng)人工智能的迭代算法和場(chǎng)景。易用性是指開發(fā)門檻更低，開發(fā)者更容易上手，結(jié)合實(shí)際場(chǎng)景進(jìn)行定制化開發(fā)。高性能是指芯片產(chǎn)品的基本性能和性價(jià)比必須達(dá)到國(guó)際先進(jìn)水平，才能進(jìn)行市場(chǎng)開拓。

2022年第二季度獨(dú)立GPU市場(chǎng)（包括AIB 合作伙伴顯卡）份額

來源：Jon Peddie Research

算力往往是市場(chǎng)對(duì)GPU性能優(yōu)劣的“第一印象”。但高端GPU的性能不等于紙面性能，尤其不能用單一性能的紙面數(shù)據(jù)來衡量。

在實(shí)際使用的過程中，GPU的通用性、易用性、實(shí)際性的重要程度遠(yuǎn)大于紙面標(biāo)出的算力這一單一性能。紙面指標(biāo)標(biāo)得再高，也要關(guān)注內(nèi)存和帶寬夠不夠，以及芯片之間的互聯(lián)等問題解決得好不好。用單一性能來衡量GPU是否高端，是一個(gè)常見的誤區(qū)。

高性能計(jì)算將是主要“競(jìng)技場(chǎng)”

長(zhǎng)期以來，英偉達(dá)一直主導(dǎo)著高端GPU市場(chǎng)，市場(chǎng)份額超過90%，尤其是在人工智能計(jì)算領(lǐng)域。到目前為止，英偉達(dá)已經(jīng)推出Volta、Ampere、Hopper等用于高性能計(jì)算和AI訓(xùn)練的架構(gòu)，并在此基礎(chǔ)上推出了V100、A100、H100等高端GPU。面向向量的雙精度浮點(diǎn)運(yùn)算能力從7.8 TFLOPS一路走到30 TFLOPS。

作為全球第二大獨(dú)立GPU供應(yīng)商，AMD雖在高端GPU的整體份額與英偉達(dá)存在差距，但在超算領(lǐng)域闖出了一片天。在最新全球超級(jí)計(jì)算機(jī)TOP500榜單上，世界上最快的超級(jí)計(jì)算機(jī)橡樹嶺國(guó)家實(shí)驗(yàn)室（ORNL）前沿、世界排名第三的超級(jí)計(jì)算機(jī)LUMI，都采用了AMD EPYC處理器和AMD Instinct MI250X GPU加速器。

AMD在超算領(lǐng)域的亮眼表現(xiàn)，是建立在針對(duì)性的軟硬件設(shè)計(jì)上，基于CDNA 2架構(gòu)的GPU加速器、ROCm軟件平臺(tái)與開源應(yīng)用程序資源中心AMD Infinity Hub的組合，構(gòu)成了對(duì)于科研人員更加友好的硬件性能和編程環(huán)境。

雖然直接使用GPU進(jìn)行高性能或AI計(jì)算更方便，但上層應(yīng)用降本增效的核心需求對(duì)底層算力提出了更高的要求。國(guó)外AI創(chuàng)業(yè)公司推出的AI芯片往往基于一種新的架構(gòu)，全面提升并側(cè)重優(yōu)化并行計(jì)算能力。國(guó)內(nèi)領(lǐng)先的AI芯片公司也出于同樣的考慮，推出了一系列基于DSA架構(gòu)的人工智能計(jì)算芯片。

在國(guó)內(nèi)市場(chǎng)，基于架構(gòu)創(chuàng)新的DSA芯片產(chǎn)品日益豐富。如華為自研的面向AI計(jì)算的架構(gòu)特色達(dá)芬奇，昆侖芯科技推出的第一代架構(gòu)XPU-K和第二代架構(gòu)XPU-R，燧原科技的自研架構(gòu)GCU-CARA等，都已經(jīng)進(jìn)入規(guī)模落地階段。隨著AI計(jì)算的應(yīng)用場(chǎng)景越來越細(xì)分和復(fù)雜，定制化和異構(gòu)化DSA有望在下一代計(jì)算平臺(tái)中發(fā)揮更大的作用。

新應(yīng)用領(lǐng)域?qū)映霾桓F

全球?yàn)?zāi)難性氣候事件正在不斷增加，提前預(yù)測(cè)此類事件對(duì)保護(hù)人類安全越來越重要，因此未來一年與氣候預(yù)測(cè)相關(guān)的應(yīng)用程序?qū)⒃贖PC領(lǐng)域備受關(guān)注。此外，隨著HPC在云端的使用，將有更多HPC應(yīng)用于消費(fèi)導(dǎo)向的軟件程序開發(fā)，虛擬世界和元宇宙概念的出現(xiàn)，也讓HPC迎來新的發(fā)展機(jī)遇，既可用于游戲（AR/VR）等娛樂應(yīng)用，也可用于數(shù)字孿生等模擬應(yīng)用。

HPC市場(chǎng)正在擴(kuò)展新的領(lǐng)域，在傳統(tǒng)的模擬和建模過程中加入人工智能（AI）和數(shù)據(jù)分析技術(shù)。新冠疫情的爆發(fā)增加了對(duì)靈活、可擴(kuò)展的云端HPC解決方案的需求，這一需求連同各個(gè)垂直行業(yè)（生命科學(xué)、汽車、金融、游戲、制造業(yè)、航空航天等）對(duì)快速處理數(shù)據(jù)和高精度日益增長(zhǎng)的需求，將會(huì)是未來幾年推動(dòng)HPC應(yīng)用增長(zhǎng)的主要因素。AI、邊緣計(jì)算、5G等技術(shù)將拓寬HPC的功能，從而形成新的芯片/系統(tǒng)架構(gòu)，為各個(gè)行業(yè)提供高效處理和分析能力。

提高HPC安全性將成為關(guān)鍵

當(dāng)市場(chǎng)整體的數(shù)字化程度提升，則安全風(fēng)險(xiǎn)也將隨之增加。越來越多的高性能計(jì)算正在遠(yuǎn)離數(shù)據(jù)中心，將直接導(dǎo)致無法通過軟件補(bǔ)丁處理的攻擊數(shù)量增加。這給開發(fā)團(tuán)隊(duì)帶來巨大壓力，迫使他們緊急推出硬件來解決這些問題，由此縮短硬件設(shè)計(jì)周期。因此提高開發(fā)者的生產(chǎn)效率以緊跟上市需求的步伐將成為下一步布局重點(diǎn)。

HPC處理器架構(gòu)多樣化

隨著數(shù)據(jù)量增加，不僅是安全性，基礎(chǔ)設(shè)施存儲(chǔ)以及數(shù)據(jù)處理的計(jì)算能力必須得到提升。此外，新的架構(gòu)包括芯片間的連接也是推動(dòng)新需求所必需的。

受到不斷變化的AI工作負(fù)載、靈活的計(jì)算（CPU、GPU、FPGA、DPU等）、成本、內(nèi)存和IO吞吐量等因素共同驅(qū)動(dòng)，HPC架構(gòu)正在經(jīng)歷巨變。微架構(gòu)層面變得互連更快、計(jì)算密度更高存儲(chǔ)可拓展、基礎(chǔ)設(shè)施效率更高、生態(tài)友好性、空間管理和安全性更高。從系統(tǒng)的角度來看，下一代HPC架構(gòu)將出現(xiàn)分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長(zhǎng)，不同的專用處理架構(gòu)將集成在單個(gè)節(jié)點(diǎn)中，在模塊之間實(shí)現(xiàn)精密、靈活的切換。如此復(fù)雜的系統(tǒng)也帶來了巨大的驗(yàn)證挑戰(zhàn)，尤其是系統(tǒng)的IP或節(jié)點(diǎn)、軟硬件動(dòng)態(tài)協(xié)調(diào)、基于工作負(fù)載的性能、電源等相關(guān)驗(yàn)證。要滿足這些驗(yàn)證需求，需要開發(fā)新的軟硬件驗(yàn)證方法。

移動(dòng)數(shù)據(jù)對(duì)電力和時(shí)間有很大的需求，這是系統(tǒng)管理者現(xiàn)在面臨的挑戰(zhàn)之一，減少數(shù)據(jù)移動(dòng)量將成為未來的一種趨勢(shì)。我們需要繼續(xù)擴(kuò)展資源，利用高級(jí)封裝和芯片間接口來支持更高性能的設(shè)備，即通過使用多裸晶來擴(kuò)展設(shè)備內(nèi)的處理能力，這在未來一年內(nèi)有望真正實(shí)現(xiàn)。

高性能計(jì)算

液冷解決方案

在深度學(xué)習(xí)、視覺計(jì)算、圖像渲染、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)的迅猛發(fā)展的大背景下，高性能計(jì)算HPC、液冷散熱已經(jīng)不再是少數(shù)大公司或大型科研機(jī)構(gòu)的專屬要求，而是被越來越多的包括政府、教育科研、遙感測(cè)繪、醫(yī)藥研發(fā)、小分子研究、細(xì)胞治療、圖像識(shí)別的客戶所需要和接受。

藍(lán)海大腦為滿足客戶需求，結(jié)合行業(yè)特點(diǎn)從計(jì)算節(jié)點(diǎn)、網(wǎng)絡(luò)、存儲(chǔ)、功耗、擴(kuò)展、散熱等方面出發(fā)，提出完善的解決方案。

產(chǎn)品特性

機(jī)架式液冷設(shè)計(jì)，即插即用，快速輕松投入使用；

支持最多9塊GPU圖形卡和2顆CPU處理器；

機(jī)架的存儲(chǔ)空間可大大擴(kuò)展，可用于云存儲(chǔ)服務(wù)；

液冷系統(tǒng)密度更高、更節(jié)能、防噪音效果更好；

高效節(jié)能、綠色環(huán)保

客戶收益

超融合架構(gòu)承擔(dān)著計(jì)算資源池和分布式存儲(chǔ)資源池的作用，極大地簡(jiǎn)化了數(shù)據(jù)中心的基礎(chǔ)架構(gòu)，通過軟件定義的計(jì)算資源虛擬化和分布式存儲(chǔ)架構(gòu)實(shí)現(xiàn)無單點(diǎn)故障、無單點(diǎn)瓶頸、彈性擴(kuò)展、性能線性增長(zhǎng)等能力。

通過簡(jiǎn)單方便的統(tǒng)一管理界面，實(shí)現(xiàn)對(duì)數(shù)據(jù)中心計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、虛擬化等資源的統(tǒng)一監(jiān)控、管理和運(yùn)維。

超融合基礎(chǔ)架構(gòu)形成的計(jì)算資源池和存儲(chǔ)資源池直接可以被云計(jì)算平臺(tái)進(jìn)行調(diào)配，服務(wù)于OpenStack、EDP、Docker、Hadoop、R、HPC等IaaS、PaaS、SaaS平臺(tái)，對(duì)上層的應(yīng)用系統(tǒng)或應(yīng)用集群等進(jìn)行支撐。

分布式存儲(chǔ)架構(gòu)簡(jiǎn)化容災(zāi)方式，實(shí)現(xiàn)同城數(shù)據(jù)雙活和異地容災(zāi)。現(xiàn)有的超融合基礎(chǔ)架構(gòu)可以延伸到公有云，可以輕松將私有云業(yè)務(wù)遷到公有云服務(wù)。

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴