吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

科技云報道:從“算力核彈”到生成式AI,新紀元還有多遠?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2024-03-27 13:50 ? 次閱讀

科技云報道原創。

“我們需要更大的GPU”!

3月19日凌晨,一年一度的“AI風向標”重磅會議——GTC 2024如期而至。

英偉達CEO黃仁勛在大會上發布了包括新一代加速計算平臺NVIDIA Blackwell、Project GR00T人形機器人基礎模型、Omniverse Cloud API、NVIDIA DRIVE Thor集中式車載計算平臺等在內的一系列突破性科技成果。

其中,NVIDIA Blackwell作為英偉達的“王炸”力作,再次將AI芯片的技術標準推向了新的高度。

緊接著,NVIDIA和亞馬遜云科技宣布了雙方的擴展合作,Blackwell將很快登陸亞馬遜云科技,并與亞馬遜云科技引以為傲的網絡連接、高級虛擬化和超大規模集群等領先技術結合,為數萬億參數規模的大模型推理工作負載帶來巨大的性能飛躍。

萬億級參數規模正處在當前全球頂級大模型的實際參數區間,也許用戶很快就能在各種生成式AI應用中體驗到新硬件帶來的提升。

“王炸”AI芯片誕生

訓練萬億參數級別的大模型,需要多大規模的算力?

在GTC現場,黃仁勛首先算了一道數學題。以OpenAI最先進的1.8萬億參數大模型為例,該模型需要幾萬億的Token進行訓練。

萬億參數與數萬億的Token相乘,就是訓練OpenAI最先進大模型所需的計算規模。黃仁勛估算,如果用一顆petaflop(每秒鐘進行1千萬億次運算)量級的GPU進行運算,需要1000年的時間才能完成。

在Transformer發明后,大模型的規模正在以驚人的速度擴展,平均每6個月就會翻倍,這意味著萬億級別參數并不是大模型的上限。

在這種趨勢下,黃仁勛相信,生成式AI的迭代和發展,需要更大的GPU、更快的GPU互連技術、更強大的超級計算機內部連接技術,以及更龐大的超級計算機巨型系統。

一直以來,NVIDIA推出的GPU一般是兩種架構,其中面向游戲的GeForce RTX系列GPU是Ada Lovelace架構,面向AI、大數據等應用的專業級顯卡是Hopper架構。風靡世界的H100就是基于Hopper架構。

雖然Hopper已經能夠滿足大部分商用市場的需求,但黃仁勛認為這樣還不夠:“我們需要更大的GPU,更需要將GPU堆疊在一起?!?/span>

于是,同時用以上兩種架構類型的產品Blackwell誕生了。Blackwell是英偉達祭出的第六代芯片架構。這塊小小的GPU,集成了2080億個晶體管,擁有著超強的算力,也顛覆了此前所有的產品。

據黃仁勛透露,英偉達為該芯片的研發投入了100億美元。這一新架構以加州大學伯克利分校數學家David Harold Blackwell命名。他專門研究博弈論和統計學,也是第一位入選美國國家科學院的黑人學者。

Blackwell在單芯片訓練方面的FP8性能是其上一代架構的2.5倍,在推理方面的 FP4 性能是其上一代架構的5倍。它具有第五代NVLink互連,速度是Hopper的兩倍,并且可擴展至576個GPU。

所以,Blackwell不是一個芯片,而是一個平臺。

NVIDIA GB200 Grace Blackwell超級芯片通過900GB/s超低功耗的片間互聯,將兩個NVIDIA B200 Tensor Core GPU與NVIDIA Grace CPU相連。

其巨大的性能升級,能為人工智能公司提供20 petaflops或每秒2萬億次計算的AI性能,相較于H100,大語言模型性能提升30倍,同時能耗只有1/25。

不難看出,Blackwell平臺如此卓越的性能提升,是為了下一代生成式AI做準備。而從OpenAI最近發布的Sora和已經開始研發更強大、更復雜的GPT-5模型也能看出,生成式AI的下一步是多模態和視頻,也就意味著更大規模的訓練。Blackwell帶來了更多可能性。

如今,從谷歌的無邊搜索引擎,到亞馬遜的云頂天堂,再到特斯拉智能駕駛,各大科技巨頭正紛紛加入NVIDIA的Blackwell陣營,開啟了一場令人興奮的AI加速計算盛宴。

亞馬遜、谷歌、戴爾、Meta、微軟、OpenAI、Oracle、特斯拉等行業翹楚都在爭先恐后地布局,準備在AI新時代大展身手。

難掩戰略焦慮

受益于去年以來生成式AI的火爆,2月21日盤后,英偉達公布的最新一季度財報再次打破市場預期。財報顯示,2024財年,英偉達總營收達609億美元,同比增長125.85%;凈利潤為297.6億美元,同比增長超581%;調整后每股盈利為12.96美元,同比增長288%。此次已經是英偉達實現連續四個季度的盈利超出市場預期。

英偉達的業績加速實則反映了全球科技公司對于AI算力需求的激增。隨著Sora等應用的橫空出世,世人看到了大模型落地的巨大潛力。

生成式 AI很有可能進入“軍備競賽”階段,與之伴隨的是科技公司對芯片的需求也會持續提升。

Counterpoint Research的數據顯示,2023年,英偉達的營收將飆升至303億美元,比2022年的163億美元增長86%,躍升為2023年全球第三大半導體廠商

富國銀行則預計,英偉達2024年將會在數據中心市場獲得高達457億美元的營收,或創下歷史新高。

不過,創造歷史的英偉達并非高枕無憂。英偉達在AI計算的“壟斷”的現狀并不讓所有人都滿意,競爭對手在竭力打破英偉達的統治地位,客戶也需要第二個AI芯片供應源。

盡管英偉達的GPU有很多優點,不過它在用于AI時它可能耗電量太高且編程復雜。從創業公司到其他芯片制造商和科技巨頭,英偉達的競爭對手層出不窮。

近期,OpenAI CEO奧爾特曼正在與中東阿布扎比G42基金、日本軟銀集團等全球投資者籌集超過80億美元資金,成立一家全新AI 芯片公司,目標是利用資金建立一個工廠網絡來制造芯片,直接對標英偉達。

2月17日,業內人士透露,日本投資界巨頭軟銀集團創始人孫正義正在尋求籌集最高達1000億美元的資金,打造一家規模龐大的合資芯片公司,這家公司能夠與芯片設計部門Arm形成互補。

過去,AMD一直在進行其新一代AI戰略規劃,包括并購和部門重組等,但生成式AI的橫空出世導致該公司產品陣容進一步擴充:去年12月發布的MI300芯片專門面向復雜的AI大模型,配置了1530億個晶體管、192GB的內存、每秒5.3TB的內存帶寬,分別是英偉達最強AI芯片H100的大約2倍、2.4倍和1.6倍。

亞馬遜云科技也在自研芯片領域進行持續投入,以提升客戶云上工作負載性價比。亞馬遜云科技很早就面向AI領域推出了Trainium訓練芯片和Inferentia推理芯片兩個系列,并不斷更新迭代。

去年底推出Trainium2能夠通過云中擴展和網絡互聯提供65exaflops的AI算力,數周時間即可完成3千億參數的大語言模型的訓練。這些AI芯片已被使用在包括Anthropic等生成式AI領域的頭部企業當中。

這些大廠不約而同地砸下重金,選擇自研AI芯片,透露出誰都不想將科技的話語權和主導權交到芯片大廠的手中,只有處于“AI食物鏈”頂端,才有可能掌握通向未來的鑰匙。

研發為底,生態為徑

黃仁勛曾在很多地方有過這樣的表示:英偉達不是在銷售芯片,而是在銷售解決問題的能力。

在這種產業生態共建的理念驅動下,英偉達圍繞GPU打造了一個涵蓋硬件、軟件及開發工具在內的生態系統。

例如,英偉達在自動駕駛領域的投資成果顯著,其Drive PX系列平臺以及后來推出的Drive AGX Orin系統級芯片,成為了眾多汽車制造商實現高級駕駛輔助系統(ADAS)和自動駕駛的關鍵部件,這是底層技術創新與實際應用場景深度融合的成功案例。

面對行業競爭,英偉達希望發揮整體的生態協作力量,共同為產業服務,為市場服務。

英偉達與云計算“一哥”亞馬遜云科技的合作同樣成果不凡,從第一個GPU云實例到現在的Blackwell平臺解決方案,雙方的合作已經超過13年??蛻艉芸炀湍茉趤嗰R遜云科技上使用基于NVIDIA GB200 Grace Blackwell Superchip和B100 Tensor Core GPUs的基礎設施。

英偉達的超強算力芯片系統與亞馬遜云科技強大的Elastic Fabric Adapte(EFA)網絡連接能力、高級虛擬化(Amazon Nitro System)和超大規模集群(Amazon EC2 UltraClusters)等領先技術的結合,使得客戶能夠更快更大規模且更安全地在云上構建和運行數萬億參數的大語言模型。

在大模型研發領域,萬億級參數規模此前還算是一道門檻。根據公開的報道,去年年中發布的GPT4的模型參數是1.8萬億,由8個220B模型組成;前不久發布的Claude3模型沒有公布參數規模,而馬斯克最新開源的Grok大模型參數是3140億參數規模。

雙方此次合作,有望在加速萬億級別大語言模型的研發方面,為生成式AI領域的突破提供新的可能。

英偉達自身的AI團隊專門在亞馬遜云科技上構建了Project Ceiba項目,以幫助其推動未來生成式AI的創新。

Ceiba項目首次亮相是在2023年11月底亞馬遜云科技2023 re:Invent全球大會上,這是當時英偉達與亞馬遜云科技合作建造的世界上最快的AI超級計算之一,當時的計算性能為65 exaflops。

隨著Blackwell平臺加入Ceiba項目,為其帶來了7倍于原先的計算性能,現在,該AI超級計算機將能夠處理高達414 exaflops的AI計算量。

新的Ceiba項目擁有20,736顆B200 GPU的超級計算機,采用新型NVIDIA GB200 NVL72系統構建,該系統利用第五代NVLink技術連接10,368顆NVIDIA Grace CPU。

系統還通過亞馬遜云科技的第四代EFA網絡進行擴展,為每個Superchip提供高達800 Gbps的低延遲、高帶寬網絡吞吐量。

此外,亞馬遜云科技還計劃提供配備基于新的英偉達B100 GPU的Amazn EC2實例,并能夠在Amazon EC2 UltraClusters中進行大規模部署。

此次合作被黃仁勛抱以更多期待:“人工智能正在以前所未有的速度推動突破,導致新的應用、商業模式和跨行業的創新。

英偉達與亞馬遜云科技的合作正在加速新的生成式AI能力的發展,并為客戶提供前所未有的計算能力,以推動可能性的邊界?!?/span>

如此多的行業,如此繁復的創新,英偉達正與其合作伙伴構建起越來越強大的AI生態,共同引領生成式AI的新紀元。用黃仁勛的話說,當計算機圖形學、物理學、人工智能交匯,便衍生出NVIDIA的靈魂。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    51170

    瀏覽量

    427244
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4774

    瀏覽量

    129352
  • 生成式AI
    +關注

    關注

    0

    文章

    514

    瀏覽量

    547
收藏 人收藏

    評論

    相關推薦

    探索未來新紀元——帶你體驗 Kafka、Zookeeper 集群安裝

    新紀元 —— 華為 Flexus X 實例的深度體驗與啟示 在計算技術日新月異的今天,如何精準匹配并高效利用資源,成為了企業數字化轉
    的頭像 發表于 01-23 16:50 ?102次閱讀
    探索未來<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>新紀元</b>——帶你體驗 Kafka、Zookeeper 集群安裝

    中國信通院栗蔚:計算與AI加速融合,如何開啟智時代新紀元

    中國信通院栗蔚:計算與AI加速融合,如何開啟智時代新紀元
    的頭像 發表于 01-17 18:48 ?540次閱讀
    中國信通院栗蔚:<b class='flag-5'>云</b>計算與<b class='flag-5'>AI</b>加速融合,如何開啟智<b class='flag-5'>算</b>時代<b class='flag-5'>新紀元</b>?

    科技報到:要更要“利”,“精裝”觸發大模型產業新變局?

    科技報到:要更要“利”,“精裝”觸發大模型產業新變局?
    的頭像 發表于 01-16 10:24 ?113次閱讀

    華為征文 計算新紀元:Flexus 服務器 X 實例引領柔性時代,部署 Zabbix 運維監控

    Flexus 服務器 X 實例購買 Flexus服務器X實例-華為 用優惠券之后 0 元!歡迎大家購買一個,動手跟我一起試試????????????????? 計算
    的頭像 發表于 01-02 11:57 ?99次閱讀
    華為<b class='flag-5'>云</b>征文 <b class='flag-5'>云</b>計算<b class='flag-5'>新紀元</b>:Flexus <b class='flag-5'>云</b>服務器 X 實例引領柔性<b class='flag-5'>算</b><b class='flag-5'>力</b>時代,部署 Zabbix 運維監控

    Flexus 服務器 X,上性能新飛躍,開啟業務增長新紀元

    大家一同體驗華為 Flexus 服務器 X 的購買過程,初步接觸到深入管理,全方位解析這一云端之旅的每一個精彩瞬間。 據華為 Flexus 官網介紹,Flexus
    的頭像 發表于 12-26 09:39 ?218次閱讀
    Flexus <b class='flag-5'>云</b>服務器 X,<b class='flag-5'>云</b>上性能新飛躍,開啟業務增長<b class='flag-5'>新紀元</b>

    Amazon Bedrock全新升級,引領生成AI應用新紀元

    近日,亞馬遜科技宣布了對Amazon Bedrock的重大升級,推出了三項創新功能,進一步鞏固了其在生成人工智能領域的領先地位。 Amazon Bedrock作為一項完全托管的服務,致力于通過
    的頭像 發表于 12-24 11:43 ?377次閱讀

    企業AI租賃是什么

    企業AI租賃是指企業通過互聯網向專業的提供商租用所需的計算資源,以滿足其AI應用的需求。
    的頭像 發表于 11-14 09:30 ?1143次閱讀

    生成AI手機如何借MediaTek天璣平臺引領智能新紀元

    在這個日新月異的科技時代,人工智能(AI)正逐步滲透到我們日常生活的方方面面,其中智能手機領域的變革尤為顯著。當生成AI技術與智能手機相融合,便催生了全新的生產
    的頭像 發表于 11-08 09:53 ?495次閱讀

    數字第一城第一廊,“中國谷”將立起“AI+”Flag

    大模型的橫空出世,成為全球技術變革的最佳注腳。人工智能,成為了新質生產構建的最有力支撐。 GPT-4o、通義千問、文心一言、kimi、豆包、元寶、海螺等自動生成大模型,文本、圖片
    的頭像 發表于 10-28 15:52 ?203次閱讀

    安謀科技異構組合,破局生成AI挑戰

    ,“此芯P1”不僅異構集成了Armv9 CPU核心與Arm Immortalis GPU,還搭載了安謀科技(中國)有限公司(以下簡稱“安謀科技”)“周易”NPU等自研業務產品。憑借高能效的異構資源、系統級的安全保障以及強大的技術生態支持,“此芯P1”將更好地滿足
    的頭像 發表于 08-13 09:12 ?629次閱讀

    涂鴉智能攜手亞馬遜科技,以生成AI重塑智慧開發新紀元

    在全球數字化轉型的浪潮中,涂鴉智能作為領先的平臺服務提供商,正攜手亞馬遜科技,通過前沿的生成AI技術,重新定義智慧領域的開發者體驗與終
    的頭像 發表于 07-09 14:31 ?505次閱讀

    亞馬遜科技與SAP攜手ERP體驗,引領AI新紀元

    近日,全球計算的領軍者亞馬遜科技與知名的企業應用解決方案提供商SAP共同宣布,雙方將擴大戰略合作,共同打造現代化的ERP體驗,并借助生成
    的頭像 發表于 06-11 14:43 ?562次閱讀

    NVIDIA Edify多模態架構升級,引領視覺生成AI新紀元

    NVIDIA近日宣布,其用于視覺生成AI的多模態架構Edify迎來重大更新,為開發者和視覺內容提供商帶來前所未有的新功能。其中,3D資產生成功能的引入,極大地提升了
    的頭像 發表于 03-27 10:22 ?515次閱讀

    高通重磅發布第三代驍龍7+,引領AI與性能新紀元

    近日,科技界掀起一陣狂潮,高通技術公司盛大發布第三代驍龍7+移動平臺,此舉不僅將終端側生成AI技術首次引入驍龍7系,更在性能上實現飛躍,CPU性能飆升15%,GPU性能更是驚人提升45%。這一革命性的移動平臺,無疑將引領智能手
    的頭像 發表于 03-25 09:46 ?1524次閱讀
    羊和鼠做生意摆件| 百家乐QQ群娱乐| 青鹏棋牌游戏大厅v3.0| 百家乐官网破解| 百家乐论坛官网| 百家乐官网赌的技巧| 属蛇做生意坐向| 云鼎娱乐城怎么存钱| 百家乐官网娱乐分析软件v4.0| 百家乐游戏模拟| 含山县| 做生意房门挂啥招财| 二八杠怎么赢钱| 百家乐官网公式与赌法| 威尼斯人娱乐老品牌| 百家乐官网分析仪博彩正网 | 网络百家乐官网输了很多钱| 百家乐微笑打法| 百家乐官网代理加盟| 澳门百家乐开户投注| 皇冠在线代理| 百家乐平投注法| 利高在线娱乐城| 真钱百家乐哪里最好| 宁波市| 网上百家乐返水| 网上百家乐官网真实度| 澳门百家乐玩法与游戏规则| 利来游戏| 百家乐博彩策略论坛| 大发888为什么打不开| 真人百家乐官网的玩法技巧和规则| 大发888扑克下载| 新东方百家乐官网娱乐城| 利博娱乐城开户| 独赢百家乐全讯网| 星座| 百家乐作弊知识| 百家乐官网下对子的概率| 威尼斯人娱乐城地图| 东莞百家乐官网的玩法技巧和规则 |