吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

河套IT TALK 89:(原創(chuàng))算力引爆智能時(shí)代:解鎖無(wú)限潛能

共熵服務(wù)中心 ? 來(lái)源:未知 ? 2023-06-04 00:45 ? 次閱讀

b133b62c-022d-11ee-90ce-dac502259ad0.png

前文我們聊到了人工智能大模型的關(guān)鍵之一數(shù)據(jù),今天,我們?cè)倭牧牧硗庖粋€(gè)關(guān)鍵點(diǎn)——算力

1. 海量的算力市場(chǎng)空間

早在1961年,計(jì)算機(jī)科學(xué)家和人工智能先驅(qū)約翰·麥卡錫 (John McCarthy)就在麻省理工學(xué)院百年慶典上的演講上講過(guò):“如果我提倡的那種計(jì)算機(jī)成為未來(lái)的計(jì)算機(jī),那么計(jì)算可能有一天會(huì)被組織成一種公共事業(yè),就像電話系統(tǒng)是一種公共事業(yè)一樣……計(jì)算機(jī)事業(yè)可能成為一個(gè)新的重要行業(yè)的基礎(chǔ)。”。不得不承認(rèn),這種觀點(diǎn)在當(dāng)時(shí)是非常先進(jìn)和前瞻性的。經(jīng)過(guò)IT行業(yè)和通信行業(yè)辛苦奮斗大半個(gè)世紀(jì),如今,他的設(shè)想已經(jīng)成為現(xiàn)實(shí)。在數(shù)字浪潮下,算力已經(jīng)成為像水力、電力一樣的公共基礎(chǔ)資源,而數(shù)據(jù)中心通信網(wǎng)絡(luò),已經(jīng)成為重要的公共基礎(chǔ)設(shè)施。隨著數(shù)字化轉(zhuǎn)型的加速和科技創(chuàng)新的蓬勃發(fā)展,對(duì)于處理大規(guī)模數(shù)據(jù)、進(jìn)行復(fù)雜計(jì)算和實(shí)現(xiàn)人工智能的需求日益增長(zhǎng)。在當(dāng)今信息時(shí)代,算力儼然成為了推動(dòng)科技和社會(huì)發(fā)展的重要驅(qū)動(dòng)力。

根據(jù)華為發(fā)布的《計(jì)算2030》的數(shù)據(jù)統(tǒng)計(jì),全球數(shù)據(jù)量每年以指數(shù)級(jí)別增長(zhǎng),到2030年,人類(lèi)將迎來(lái)YB數(shù)據(jù)時(shí)代。其中的"YB"代表著"Yottabyte",是數(shù)據(jù)存儲(chǔ)容量的一個(gè)極大單位,相當(dāng)于2的80次方字節(jié),或者1兆兆兆兆字節(jié)。YB數(shù)據(jù)時(shí)代代表了一個(gè)數(shù)據(jù)爆炸和數(shù)據(jù)價(jià)值的新時(shí)代,通用計(jì)算算力(FP32)將增長(zhǎng)10倍,達(dá)到3.3 ZFLOPS。而AI智算算力(FP16),將增長(zhǎng)500倍,達(dá)到105 ZFLOPS。這里的Z代表"zetta",是國(guó)際計(jì)量單位前綴之一,表示10^21的倍數(shù)。ZFLOPS表示的是每秒鐘進(jìn)行的浮點(diǎn)運(yùn)算次數(shù),具體為每秒鐘進(jìn)行的10^21次浮點(diǎn)運(yùn)算。這是一個(gè)非常龐大的數(shù)值,用于衡量超級(jí)計(jì)算機(jī)或高性能計(jì)算集群的計(jì)算能力。

2. 什么是算力?

算力(Computing Power)是指計(jì)算機(jī)系統(tǒng)或設(shè)備處理數(shù)據(jù)和執(zhí)行計(jì)算任務(wù)的能力。它衡量了計(jì)算機(jī)系統(tǒng)能夠在單位時(shí)間內(nèi)完成的計(jì)算操作的數(shù)量或速度。算力通常與計(jì)算速度、計(jì)算容量和計(jì)算效率等因素相關(guān)。

衡量算力需要一系列的指標(biāo):

MIPS(Million Instructions Per Second,每秒百萬(wàn)條指令數(shù)):

IPS(Instructions Per Second,每秒指令數(shù))表示處理器每秒鐘能夠執(zhí)行的指令數(shù)量。它衡量了處理器的指令執(zhí)行能力,適用于通用計(jì)算任務(wù)。由于計(jì)算機(jī)性能的提升,現(xiàn)在普遍使用MIPS來(lái)衡量計(jì)算機(jī)或處理器每秒鐘能夠執(zhí)行的百萬(wàn)條指令數(shù)量。

DMIPS(Dhrystone MIPS,德赫斯頓百萬(wàn)指令數(shù)):

DMIPS也是衡量計(jì)算機(jī)或處理器每秒鐘能夠執(zhí)行的百萬(wàn)條指令數(shù)量,是一種常用的基準(zhǔn)測(cè)試程序。但它是基于Dhrystone基準(zhǔn)測(cè)試的結(jié)果。Dhrystone由Reinhold P. Weicker于1984年開(kāi)發(fā),旨在模擬實(shí)際應(yīng)用中的整數(shù)計(jì)算工作負(fù)載。這也是和MIPS的關(guān)鍵差別。DMIPS對(duì)整數(shù)運(yùn)算的重要性更為突出,能夠更好地評(píng)估處理器在整數(shù)計(jì)算方面的性能。而MIPS則更加通用,包括整數(shù)和浮點(diǎn)計(jì)算等不同類(lèi)型的指令。因此,某些芯片在整數(shù)計(jì)算方面表現(xiàn)出色,可能在DMIPS上得分較高,但在包括浮點(diǎn)計(jì)算的MIPS測(cè)試中可能相對(duì)較低。

FLOPS(Floating Point Operations Per Second,每秒浮點(diǎn)運(yùn)算次數(shù)):

OPS(Operations Per Second,每秒操作數(shù))表示設(shè)備或系統(tǒng)每秒鐘能夠處理的操作數(shù)量。這個(gè)指標(biāo)可以是通用計(jì)算任務(wù)的操作數(shù),也可以是特定任務(wù)中的特定操作數(shù),取決于具體的應(yīng)用場(chǎng)景。FLOPS就是衡量設(shè)備或系統(tǒng)每秒鐘能夠執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)。它是衡量計(jì)算設(shè)備在浮點(diǎn)計(jì)算方面的性能的指標(biāo),通常用于評(píng)估處理器、GPU、加速器等在科學(xué)計(jì)算、圖形渲染、機(jī)器學(xué)習(xí)等需要大量浮點(diǎn)計(jì)算的應(yīng)用中的計(jì)算能力。隨著處理器浮點(diǎn)計(jì)算性能的提升我們從一開(kāi)始的MFLOP(每秒百萬(wàn)浮點(diǎn)運(yùn)算數(shù)),提升到GFLOP(每秒十億浮點(diǎn)運(yùn)算數(shù))、TFLOP(每秒萬(wàn)億浮點(diǎn)運(yùn)算數(shù))、PFLOP(每秒千萬(wàn)億浮點(diǎn)運(yùn)算數(shù))、EFLOP(每秒百億億浮點(diǎn)運(yùn)算數(shù))和ZZFLOP(每秒十萬(wàn)億億浮點(diǎn)運(yùn)算數(shù))。

IOPS(Input/Output Operations Per Second,每秒輸入/輸出操作數(shù)):

IOPS是衡量存儲(chǔ)設(shè)備或系統(tǒng)每秒鐘可以處理的輸入/輸出操作數(shù)量。它通常用于衡量存儲(chǔ)設(shè)備的讀寫(xiě)能力,如硬盤(pán)、固態(tài)硬盤(pán)(SSD)等。

TDP(Thermal Design Power):

TDP是指在標(biāo)準(zhǔn)工作負(fù)載下芯片或處理器的最大熱設(shè)計(jì)功耗。它表示芯片在設(shè)計(jì)中考慮的散熱和冷卻要求,是制造商提供的一個(gè)指導(dǎo)值。TDP通常以瓦特(W)為單位。

功率效率:

功耗效率是指芯片在執(zhí)行特定任務(wù)時(shí)所消耗的能量與完成任務(wù)所需計(jì)算能力之間的比率。功耗效率通常以特定的計(jì)算能力單位(如FLOPS或IPS)為基準(zhǔn),表示為每瓦特(W)的計(jì)算能力或任務(wù)完成量。單位可以是FLOPS/W(每瓦特的浮點(diǎn)操作數(shù))或IPS/W(每瓦特的指令數(shù))。功耗效率越高,芯片在給定能源限制下能夠提供更高的計(jì)算性能。

Rpeak(峰值性能):

Rpeak(Peak Performance)是衡量處理器或系統(tǒng)在理論上可以達(dá)到的最高性能水平。它通常以每秒鐘可以執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)(FLOPS)或整數(shù)運(yùn)算次數(shù)(DMIPS)來(lái)表示。它反映了設(shè)備在理論上的最大計(jì)算能力,通常是在理想化的情況下,假設(shè)沒(méi)有任何限制和瓶頸。

Ravg(均值性能):

實(shí)際應(yīng)用中的計(jì)算性能往往無(wú)法達(dá)到峰值性能。這是因?yàn)閷?shí)際應(yīng)用中存在各種因素的限制,例如數(shù)據(jù)依賴(lài)性、存儲(chǔ)訪問(wèn)延遲、算法效率等。因此,考慮到這些限制因素,需要對(duì)均值性能(Ravg)進(jìn)行評(píng)估。Ravg(Average Performance)是指在實(shí)際應(yīng)用中,設(shè)備或系統(tǒng)在給定工作負(fù)載下的平均計(jì)算性能。它考慮了實(shí)際應(yīng)用中的各種因素,并提供了更接近實(shí)際應(yīng)用場(chǎng)景的性能指標(biāo)。Ravg通常基于實(shí)際測(cè)試或模擬運(yùn)行應(yīng)用程序來(lái)獲得。

另外,在現(xiàn)實(shí)的場(chǎng)景中,衡量算力的狀況會(huì)更為復(fù)雜。單個(gè)芯片算力指標(biāo)強(qiáng)大,未必多個(gè)芯片疊加,指標(biāo)性能也會(huì)想當(dāng)然的翻倍關(guān)系,因?yàn)檫@牽扯到:

    • 芯片的擴(kuò)展性能:需要考慮芯片之間的通信、協(xié)同工作、負(fù)載均衡等方面。

    • 吞吐量和并行性:要考慮它能夠同時(shí)處理多少任務(wù)、支持多少并發(fā)操作以及整體的吞吐量。這可以通過(guò)測(cè)試系統(tǒng)在高負(fù)載情況下的性能來(lái)評(píng)估。

    • 通信和數(shù)據(jù)傳輸:評(píng)估疊加系統(tǒng)時(shí),要考慮芯片之間的通信帶寬、延遲以及數(shù)據(jù)傳輸?shù)男省8咝У耐ㄐ藕蛿?shù)據(jù)傳輸能夠提高整體系統(tǒng)性能。

    • 總體能耗和功耗:如果能耗過(guò)高,也意味著運(yùn)行的OPEX高過(guò),這在成本計(jì)算中非常重要,所以評(píng)估系統(tǒng)性能時(shí),需要考慮功耗和能耗的因素,以確保疊加系統(tǒng)在提供高性能的同時(shí),能夠保持適當(dāng)?shù)墓暮湍苄А?/p>

    • 立體計(jì)算的復(fù)雜性:立體計(jì)算(Computing Continuum)是一個(gè)綜合了云計(jì)算和邊緣計(jì)算的概念,旨在提供更全面和靈活的算力支持。在傳統(tǒng)的計(jì)算模式中,云計(jì)算主要依靠中央數(shù)據(jù)中心提供計(jì)算和存儲(chǔ)資源,而邊緣計(jì)算則將計(jì)算任務(wù)分布到離數(shù)據(jù)源更近的邊緣設(shè)備上。而立體計(jì)算則結(jié)合了這兩種模式,將計(jì)算能力在云端和邊緣設(shè)備之間進(jìn)行協(xié)同和整合。立體計(jì)算的復(fù)雜性主要體現(xiàn)在算力評(píng)估和資源調(diào)度方面。由于計(jì)算任務(wù)可以在云端和邊緣設(shè)備之間進(jìn)行遷移和分配,需要綜合考慮多個(gè)因素來(lái)評(píng)估最佳的計(jì)算資源配置。這些因素包括任務(wù)的性質(zhì)和要求、數(shù)據(jù)的位置和訪問(wèn)延遲、設(shè)備的計(jì)算能力和網(wǎng)絡(luò)帶寬等。

3. 算力發(fā)展簡(jiǎn)史

在互聯(lián)網(wǎng)誕生之前,算力主要指的是單機(jī)計(jì)算能力,以大型機(jī)為代表。這些大型機(jī)由主機(jī)、終端和終端接口設(shè)備組成,擁有強(qiáng)大的計(jì)算和存儲(chǔ)能力,通常由大型企業(yè)或機(jī)構(gòu)使用。

隨著互聯(lián)網(wǎng)和通信技術(shù)的發(fā)展,計(jì)算能力逐漸向云端遷移,引發(fā)了云計(jì)算的興起。云計(jì)算利用互聯(lián)網(wǎng)實(shí)現(xiàn)對(duì)計(jì)算資源(包括處理能力、存儲(chǔ)空間和軟件服務(wù))的按需訪問(wèn)和共享。云計(jì)算提供了高度靈活、可擴(kuò)展和經(jīng)濟(jì)高效的計(jì)算模式,使個(gè)人用戶(hù)和企業(yè)能夠根據(jù)需求快速獲取和使用計(jì)算能力,而無(wú)需投資大量資金建設(shè)自己的計(jì)算基礎(chǔ)設(shè)施。

隨著云計(jì)算的發(fā)展,人們開(kāi)始意識(shí)到在特定領(lǐng)域或應(yīng)用場(chǎng)景中,需要更強(qiáng)大的計(jì)算能力來(lái)處理更大規(guī)模的數(shù)據(jù)和更復(fù)雜的計(jì)算任務(wù)。這促使了超算中心(Supercomputing Center)的出現(xiàn)。超算中心致力于構(gòu)建和運(yùn)營(yíng)高性能計(jì)算系統(tǒng),通過(guò)集群、并行計(jì)算和優(yōu)化算法等技術(shù)實(shí)現(xiàn)超級(jí)計(jì)算能力。超算中心廣泛應(yīng)用于科學(xué)研究、天氣預(yù)報(bào)、模擬計(jì)算、大規(guī)模數(shù)據(jù)分析等領(lǐng)域。

智算中心(Intelligent Computing Center)則是在超算中心基礎(chǔ)上發(fā)展起來(lái)的概念。智算中心著重于結(jié)合人工智能和大數(shù)據(jù)分析等技術(shù),提供高性能的智能計(jì)算能力。智算中心通過(guò)深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和推理等算法,實(shí)現(xiàn)對(duì)復(fù)雜任務(wù)的智能處理和決策支持。智算中心的興起與人工智能應(yīng)用的快速發(fā)展密切相關(guān)。

和提供虛擬化云計(jì)算服務(wù)的獲取、資源存儲(chǔ)、彈性擴(kuò)展和靈活性的云數(shù)據(jù)中心(Cloud Data Center)以及專(zhuān)門(mén)用于解決科學(xué)、工程、天氣預(yù)報(bào)、氣候模擬等領(lǐng)域的復(fù)雜科學(xué)計(jì)算問(wèn)題進(jìn)行高性能計(jì)算的超級(jí)計(jì)算中心(Supercomputing Center)不同,也和注重哈希計(jì)算的比特幣礦機(jī)農(nóng)場(chǎng)不同,今天我們談的算力,主要說(shuō)的是用于用于進(jìn)行復(fù)雜的人工智能數(shù)據(jù)分析、模型訓(xùn)練和智能決策的智算中心(Intelligent Computing Center)。智能計(jì)算中心可以支持人工智能應(yīng)用的開(kāi)發(fā)、訓(xùn)練和部署,例如圖像識(shí)別、自動(dòng)駕駛、自然語(yǔ)言處理、知識(shí)圖譜、智慧家居、智能制造、智能醫(yī)療、智慧城市等領(lǐng)域。它通常具有優(yōu)化的硬件架構(gòu)和軟件工具,以提供高效的AI計(jì)算能力。智算中心需求正在呈指數(shù)級(jí)增長(zhǎng),未來(lái)在社會(huì)總計(jì)算需求中將占據(jù)80%以上。智算中心是智慧時(shí)代社會(huì)經(jīng)濟(jì)運(yùn)行必不可少的基礎(chǔ)設(shè)施,目的是實(shí)現(xiàn)智算的普惠。

隨著算力的不斷提升,計(jì)算能力會(huì)變得無(wú)處不在,滲透到人們?nèi)粘I詈凸ぷ鳝h(huán)境的每一個(gè)毛孔,每一個(gè)環(huán)節(jié)。"泛在計(jì)算"(Ubiquitous Computing)會(huì)結(jié)合智能終端、物聯(lián)網(wǎng)的計(jì)算能力,數(shù)據(jù)在最合適的地方,以最合適的算力來(lái)計(jì)算,減少數(shù)據(jù)搬移,提高整體系統(tǒng)的性能。

4. 眼花繚亂的算力芯片

從基本大類(lèi)來(lái)說(shuō),基本上就是兩類(lèi),一類(lèi)是通用芯片(General-Purpose Chip),一類(lèi)是專(zhuān)用芯片(Specialized Chip)。從名稱(chēng)上就可以看出來(lái),前者具有廣泛的計(jì)算能力,設(shè)計(jì)用于處理多種不同類(lèi)型任務(wù),后者是根據(jù)特定的計(jì)算需求和應(yīng)用場(chǎng)景而設(shè)計(jì)的芯片。它們通常針對(duì)特定的計(jì)算任務(wù)進(jìn)行優(yōu)化,以提供更高效的計(jì)算能力。

通用芯片基本上說(shuō)的就是CPU(Central Processing Unit),x86和ARM都是最常見(jiàn)的通用芯片架構(gòu)。x86架構(gòu)是由英特爾(Intel)公司最早推出的一種指令集架構(gòu)。它廣泛應(yīng)用于個(gè)人電腦和服務(wù)器領(lǐng)域,并成為主流的桌面和數(shù)據(jù)中心處理器架構(gòu)。x86架構(gòu)的代表性產(chǎn)品包括英特爾的Core系列處理器和AMD的Ryzen系列處理器。ARM架構(gòu)是一種低功耗、高性能的指令集架構(gòu),主要用于移動(dòng)設(shè)備和嵌入式系統(tǒng)。它在智能手機(jī)、平板電腦和物聯(lián)網(wǎng)設(shè)備等領(lǐng)域得到廣泛應(yīng)用。ARM架構(gòu)的特點(diǎn)是能夠提供高性能和能效的平衡,使其適合于移動(dòng)設(shè)備的需求。ARM架構(gòu)的代表性產(chǎn)品包括高通(Qualcomm)、聯(lián)發(fā)科(MediaTek)和蘋(píng)果(Apple)等公司的處理器。APU(Accelerated Processing Unit)也是一種通用芯片。將CPU和GPU的計(jì)算能力集成在同一個(gè)芯片上,以提供更好的整體性能和能效。CPU負(fù)責(zé)通用計(jì)算任務(wù),而GPU則專(zhuān)注于圖形渲染和并行計(jì)算任務(wù)。通過(guò)在同一芯片上集成CPU和GPU,APU可以提供更緊密的協(xié)同工作和更高效的數(shù)據(jù)傳輸,從而提供更好的圖形處理和整體計(jì)算性能。

專(zhuān)用芯片就很多種類(lèi)了,我們經(jīng)常聽(tīng)到的DPU、GPU、NPU、TPU、FPGAASIC這些眼花繚亂的分類(lèi),都是專(zhuān)用芯片的范疇:

GPU(圖形處理器):

GPU最初設(shè)計(jì)用于圖形渲染,但由于其并行計(jì)算能力,逐漸被應(yīng)用于通用計(jì)算和人工智能。GPU具有大規(guī)模的并行處理單元,適用于并行計(jì)算密集型任務(wù),如深度學(xué)習(xí)訓(xùn)練和大規(guī)模數(shù)據(jù)處理。相比于CPU,GPU在并行計(jì)算方面表現(xiàn)出更高的性能,但功耗也相對(duì)較高。

DPU(深度學(xué)習(xí)處理器):

DPU是專(zhuān)門(mén)為深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的芯片。它具有高度優(yōu)化的硬件和軟件結(jié)構(gòu),可以加速神經(jīng)網(wǎng)絡(luò)的推理和訓(xùn)練過(guò)程。DPU通常具有高效的矩陣計(jì)算能力和低功耗特性,使其在邊緣設(shè)備和嵌入式系統(tǒng)上表現(xiàn)出色。

NPU(神經(jīng)網(wǎng)絡(luò)處理器):

NPU是專(zhuān)門(mén)為神經(jīng)網(wǎng)絡(luò)推理任務(wù)而設(shè)計(jì)的芯片。它通過(guò)硬件優(yōu)化和高度并行的計(jì)算結(jié)構(gòu),提供高效的神經(jīng)網(wǎng)絡(luò)推理性能。NPU通常在移動(dòng)設(shè)備和邊緣計(jì)算平臺(tái)上使用,以提供低功耗、實(shí)時(shí)的人工智能計(jì)算能力。

FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列):

FPGA是一種可編程的硬件芯片,可以通過(guò)配置來(lái)實(shí)現(xiàn)不同的功能和計(jì)算任務(wù)。FPGA具有高度的靈活性和可定制性,能夠適應(yīng)各種應(yīng)用需求。在人工智能計(jì)算中,F(xiàn)PGA可以通過(guò)編程實(shí)現(xiàn)特定的神經(jīng)網(wǎng)絡(luò)架構(gòu)和加速算法,從而提供高性能的定制化計(jì)算。

ASIC(專(zhuān)用集成電路):

ASIC是專(zhuān)門(mén)為特定應(yīng)用而設(shè)計(jì)的定制芯片,其功能在制造時(shí)已經(jīng)固定,無(wú)法重新編程。在人工智能計(jì)算中,一些公司開(kāi)發(fā)了專(zhuān)用的AI芯片(如Google的TPU),它們采用ASIC設(shè)計(jì),通過(guò)專(zhuān)門(mén)的電路優(yōu)化實(shí)現(xiàn)高效的人工智能計(jì)算。ASIC可以提供極高的性能和能效,但對(duì)于通用計(jì)算任務(wù)缺乏靈活性。

TPU(張量處理器):

TPU是由谷歌開(kāi)發(fā)的專(zhuān)門(mén)用于人工智能加速的芯片。TPU針對(duì)大規(guī)模的深度學(xué)習(xí)工作負(fù)載進(jìn)行了優(yōu)化,特別擅長(zhǎng)進(jìn)行高度并行的矩陣計(jì)算。TPU在訓(xùn)練和推理任務(wù)中都具有較高的性能和能效,廣泛用于云端的人工智能計(jì)算。

5. 一枝獨(dú)秀的GPU

b3b3fae2-022d-11ee-90ce-dac502259ad0.jpg

在所有上述的專(zhuān)用芯片中,GPU最近是最熱門(mén)的一種。因?yàn)楸娝苤珿PT就是用GPU進(jìn)行訓(xùn)練的。所以也讓做GPU最牛的目前絕對(duì)領(lǐng)先的市場(chǎng)地位的英偉達(dá)(NVIDIA)賺了個(gè)盤(pán)滿(mǎn)缽滿(mǎn)。

自2012年起,GPU開(kāi)始被廣泛應(yīng)用于構(gòu)建和加速深度神經(jīng)網(wǎng)絡(luò)。Kepler、Maxwell和Pascal架構(gòu)的GPU在人工智能領(lǐng)域得到越來(lái)越廣泛的應(yīng)用。隨著人工智能和云計(jì)算的快速發(fā)展,Volta成為第一個(gè)專(zhuān)注于計(jì)算方向的GPU架構(gòu),首次引入了張量核心(Tensor Cores),在深度學(xué)習(xí)場(chǎng)景下的性能比上一代Pascal架構(gòu)提高了5倍以上。從此,GPU算力正式分化為計(jì)算和圖形兩個(gè)不同的發(fā)展方向。Turing架構(gòu)更側(cè)重于圖形處理,并引入了廣為人知的RTX系列產(chǎn)品線,推出了許多面向消費(fèi)級(jí)市場(chǎng)的圖形卡。

最新的Ampere架構(gòu)則大幅增強(qiáng)了GPU在計(jì)算方向的能力。其技術(shù)突破包括采用7nm工藝、第三代張量核心(Tensor Cores)、多實(shí)例GPU(MIG)、第三代NVIDIA NVLink互聯(lián)技術(shù)、細(xì)粒度結(jié)構(gòu)稀疏性等。這些新技術(shù)帶來(lái)的特性組合使得Ampere架構(gòu)的A100 GPU成為多面手,適用于大數(shù)據(jù)分析、科學(xué)計(jì)算、深度學(xué)習(xí)訓(xùn)練和推理等主流計(jì)算場(chǎng)景。A100 GPU支持構(gòu)建具有高吞吐量和多功能性的彈性數(shù)據(jù)中心,大幅降低數(shù)據(jù)中心成本,使其成為云上算力的高性?xún)r(jià)比選擇,甚至成為行業(yè)算力計(jì)量的"通用貨幣"。許多關(guān)于算力的計(jì)算都以A100的數(shù)量為基準(zhǔn)。據(jù)估計(jì),海外巨頭平均擁有50萬(wàn)片以上的A100 GPU。國(guó)內(nèi)大廠也紛紛部署大型模型,因此可以預(yù)見(jiàn),對(duì)A100 GPU的需求將迅速增長(zhǎng)到百萬(wàn)級(jí)別。

6. 算力部署的極限思維

但我們也必須意識(shí)到依賴(lài)進(jìn)口芯片存在大概率技術(shù)依賴(lài)和供應(yīng)鏈風(fēng)險(xiǎn)。如何通過(guò)發(fā)展國(guó)產(chǎn)人工智能芯片,降低對(duì)進(jìn)口技術(shù)和產(chǎn)品的依賴(lài),提高技術(shù)獨(dú)立性,減少潛在的安全和政策風(fēng)險(xiǎn),是不可回避的問(wèn)題。

中美關(guān)系的復(fù)雜性,使得我國(guó)大廠直接采用英偉達(dá)A100的可能性在下降,更不要說(shuō)新發(fā)布的更強(qiáng)算力的H100了。所以要極限思維,做到提前戰(zhàn)略部署,是非常急迫的挑戰(zhàn)。

近期看到了北京、深圳在提升算力方面的政策出臺(tái):

《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》(簡(jiǎn)稱(chēng)《實(shí)施方案》)提出,推動(dòng)國(guó)產(chǎn)人工智能芯片實(shí)現(xiàn)突破。面向人工智能云端分布式訓(xùn)練需求,開(kāi)展通用高算力訓(xùn)練芯片研發(fā);面向邊緣端應(yīng)用場(chǎng)景的低功耗需求,研制多模態(tài)智能傳感芯片、自主智能決策執(zhí)行芯片、高能效邊緣端異構(gòu)智能芯片;面向創(chuàng)新型芯片架構(gòu),探索可重構(gòu)、存算一體、類(lèi)腦計(jì)算、Chiplet等創(chuàng)新架構(gòu)路線。積極引導(dǎo)大模型研發(fā)企業(yè)應(yīng)用國(guó)產(chǎn)人工智能芯片,加快提升人工智能算力供給的國(guó)產(chǎn)化率。

《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023—2024年)》也提到了強(qiáng)化智能算力集群供給,包括:建設(shè)城市級(jí)智能算力平臺(tái)、打造大灣區(qū)智能算力樞紐以及建設(shè)企業(yè)級(jí)智能算力平臺(tái)。

從這些動(dòng)作看來(lái),加強(qiáng)技術(shù)獨(dú)立性,加快智能芯片開(kāi)發(fā)、加快智算中心的部署迫在眉睫,刻不容緩。為北京和深圳點(diǎn)贊

針對(duì)算力,除了芯片,其實(shí)還有很多可以聊的話題,為此,還是拆成兩期,智愿君下期再深入談一下智算中心所涉及的技術(shù),咱們下期再見(jiàn)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    389

    瀏覽量

    7992
  • OpenHarmony
    +關(guān)注

    關(guān)注

    25

    文章

    3747

    瀏覽量

    16587

原文標(biāo)題:河套IT TALK 89:(原創(chuàng))算力引爆智能時(shí)代:解鎖無(wú)限潛能

文章出處:【微信號(hào):開(kāi)源技術(shù)服務(wù)中心,微信公眾號(hào):共熵服務(wù)中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI智能時(shí)代的核心驅(qū)動(dòng)力

    引言在當(dāng)今數(shù)字化時(shí)代的重要性不言而喻。12月28日,央視和國(guó)務(wù)院國(guó)資委聯(lián)合制作的紀(jì)錄片《大國(guó)基石》第三期《引擎》中所強(qiáng)調(diào)的“
    的頭像 發(fā)表于 01-22 12:58 ?173次閱讀
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b>:<b class='flag-5'>智能</b><b class='flag-5'>時(shí)代</b>的核心驅(qū)動(dòng)力

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智中心算
    的頭像 發(fā)表于 01-16 14:03 ?474次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    解鎖智慧路燈燈桿屏運(yùn)營(yíng)無(wú)限潛能,盾華電子“聚星”等您共拓共贏停車(chē)大市場(chǎng)!

    解鎖智慧燈桿屏潛能,盾華“聚星”等您共
    的頭像 發(fā)表于 10-15 18:02 ?316次閱讀
    <b class='flag-5'>解鎖</b>智慧路燈燈桿屏運(yùn)營(yíng)<b class='flag-5'>無(wú)限</b><b class='flag-5'>潛能</b>,盾華電子“聚星”等您共拓共贏停車(chē)大市場(chǎng)!

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

    國(guó)慶前就收到《大模型時(shí)代的基礎(chǔ)架構(gòu)》一書(shū),感謝電子發(fā)燒友論壇。歡度國(guó)慶之余,今天才靜下心來(lái)體驗(yàn)此書(shū),書(shū)不厚,200余頁(yè),彩色圖例,印刷精美! 當(dāng)初申請(qǐng)此書(shū),主要是看到副標(biāo)題“大模型中心建設(shè)指南
    發(fā)表于 10-08 10:40

    中國(guó)大會(huì)召開(kāi),業(yè)界首個(gè)高質(zhì)量評(píng)估體系發(fā)布

    首次完整地構(gòu)建了人工智能時(shí)代高質(zhì)量的理論體系,并探索性提出業(yè)界首個(gè) "五位一體"的高質(zhì)量
    的頭像 發(fā)表于 09-28 16:50 ?295次閱讀
    中國(guó)<b class='flag-5'>算</b><b class='flag-5'>力</b>大會(huì)召開(kāi),業(yè)界首個(gè)<b class='flag-5'>算</b><b class='flag-5'>力</b>高質(zhì)量評(píng)估體系發(fā)布

    中國(guó)智能汽車(chē)騰飛,為什么異構(gòu)是第一生產(chǎn)

    智能時(shí)代的“世紀(jì)之車(chē)”,異構(gòu)是第一驅(qū)動(dòng)力
    的頭像 發(fā)表于 09-14 10:32 ?3819次閱讀
    中國(guó)<b class='flag-5'>智能</b>汽車(chē)騰飛,為什么異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產(chǎn)<b class='flag-5'>力</b>?

    淺析三大之異同

    隨著一年多前ChatGPT的出現(xiàn)引爆人工智能(AI)浪潮,支撐大模型背后的“”概念突然闖進(jìn)我們的視野,成為科技圈炙手可熱的新詞,引領(lǐng)著最新潮流。作為數(shù)字經(jīng)濟(jì)
    的頭像 發(fā)表于 08-30 12:56 ?1191次閱讀
    淺析三大<b class='flag-5'>算</b><b class='flag-5'>力</b>之異同

    大模型時(shí)代需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書(shū)中找到答案。
    發(fā)表于 08-20 09:04

    遠(yuǎn)鑄智能發(fā)布最新白皮書(shū) 高溫腔室解鎖FDM 3D打印無(wú)限潛能

    INTAMSYS 近日發(fā)布的最新白皮書(shū)——《高溫腔室解鎖 FDM 3D 打印無(wú)限潛能》,針對(duì)這一問(wèn)題進(jìn)行了深入研究,通過(guò)理論分析和實(shí)驗(yàn)測(cè)試,將高溫腔室技術(shù)對(duì)打印件的影響進(jìn)行了量化和清晰的闡述,為行業(yè)提供了更科學(xué)、更實(shí)用的指導(dǎo)。
    的頭像 發(fā)表于 07-19 13:55 ?468次閱讀
    遠(yuǎn)鑄<b class='flag-5'>智能</b>發(fā)布最新白皮書(shū) 高溫腔室<b class='flag-5'>解鎖</b>FDM 3D打印<b class='flag-5'>無(wú)限</b><b class='flag-5'>潛能</b>

    異構(gòu)計(jì)算:解鎖潛能的新途徑

    在這個(gè)數(shù)據(jù)爆炸的時(shí)代,計(jì)算是推動(dòng)社會(huì)與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運(yùn)行到超級(jí)計(jì)算機(jī)的尖端模擬,均依賴(lài)強(qiáng)大的計(jì)算能力。但面對(duì)多樣化的復(fù)雜計(jì)算任務(wù),單一處理器難以勝任。于是,異構(gòu)計(jì)算作為新興
    的頭像 發(fā)表于 07-18 08:28 ?9921次閱讀
    異構(gòu)計(jì)算:<b class='flag-5'>解鎖</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>潛能</b>的新途徑

    力系列基礎(chǔ)篇——與計(jì)算機(jī)性能:解鎖超能力的神秘力量!

    在《力系列基礎(chǔ)篇——101:從零開(kāi)始了解》中,相信各位粉絲初步了解到人工智能的“發(fā)動(dòng)機(jī)
    的頭像 發(fā)表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>與計(jì)算機(jī)性能:<b class='flag-5'>解鎖</b>超能力的神秘力量!

    力系列基礎(chǔ)篇——101:從零開(kāi)始了解

    相信大家已經(jīng)感受到,我們正處在一個(gè)人工智能時(shí)代。如果要問(wèn)在人工智能時(shí)代最重要的是什么?那必須是:
    的頭像 發(fā)表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:從零開(kāi)始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    聚焦全國(guó)一體化體系構(gòu)建,憶聯(lián)以強(qiáng)大存“引擎”釋放潛能

    是數(shù)字時(shí)代的生產(chǎn),為數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)深度融合提供了強(qiáng)大支持。在不久前結(jié)束的全國(guó)兩會(huì)中,“全國(guó)一體化
    的頭像 發(fā)表于 03-22 18:13 ?579次閱讀
    聚焦全國(guó)一體化<b class='flag-5'>算</b><b class='flag-5'>力</b>體系構(gòu)建,憶聯(lián)以強(qiáng)大存<b class='flag-5'>力</b>“引擎”釋放<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>潛能</b>

    時(shí)代, 如何打破內(nèi)存墻

    設(shè)計(jì)的不斷革新,進(jìn)入了大時(shí)代。 目前,主流AI芯片的架構(gòu)仍然沿用了傳統(tǒng)的馮·諾依曼模型,這一設(shè)計(jì)將計(jì)算單元與數(shù)據(jù)存儲(chǔ)分離。在這種架構(gòu)下,處理器需要從內(nèi)存中讀取數(shù)據(jù),執(zhí)行計(jì)算任務(wù),然后將結(jié)果寫(xiě)回內(nèi)存。盡管AI芯片的
    的頭像 發(fā)表于 03-06 19:51 ?353次閱讀
    大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>時(shí)代</b>, 如何打破內(nèi)存墻
    3U百家乐官网的玩法技巧和规则| 凱旋門百家乐官网娱乐城| 百家乐官网网络公式| 德州扑克学校| 蓝盾百家乐的玩法技巧和规则| 最好的百家乐论坛| 网上百家乐官网赌博网| 菲律百家乐官网太阳城| 临江市| 波克棋牌游戏大厅下载| 大发888备用地址| 百家乐庄牌| 中国百家乐的玩法技巧和规则 | 飞天百家乐官网的玩法技巧和规则 | 百家乐两头压注| 百家乐官网tt娱乐场开户注册| 百家乐官网在线投注系统| 博彩qq群| 伟博娱乐城| 大发888娱乐城 34hytrgwsdfpv | 百家乐官网客户端下载| 浦县| 明升88备用| bet365里面的21点玩不得| 大发888游戏充值| 百家乐技巧开户| 伟易博百家乐的玩法技巧和规则| 百家乐龙虎斗等| 百家乐巴黎| 百家乐打印机分析| 做生意店门口有个马葫芦盖风水| 广州百家乐官网桌子| 百家乐官网八卦九| 圣安娜百家乐官网代理| 缅甸百家乐官网玩家吗| 百家乐官网赌博论谈| 百家乐官网翻天youtube| 至尊百家乐官网20111110| 百家乐官网博彩策略论坛| 太阳城百家乐官网的破解| 哪里有百家乐官网投注网|