吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI終端時代:端側(cè)算力快速提升,AI芯片競爭進入新的階段

Monika觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:莫婷婷 ? 2024-04-22 07:49 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/莫婷婷)全球終端市場在經(jīng)歷了高峰之后,在2022年、2023年出現(xiàn)明顯的終端市場下滑。進入2024年,全球終端市場又迎來了小幅反彈,AI技術(shù)的加持是市場反彈的動力之一。毫不夸張地說,是AI重新點燃了終端市場。

2023年被認為是AI終端的元年,那么進入2024年,AI終端市場會迎來哪些發(fā)展機會,上游的芯片環(huán)節(jié),AI芯片有哪些最新解決方案。

AI終端成為交互入口,首款A(yù)I PC個人智能體已經(jīng)面世

為什么AI算力會轉(zhuǎn)移到終端側(cè)?IDC中國及全球副總裁王吉平提到了四大方面的原因。

一是芯片廠商技術(shù)革命,未來是在混合算力的基礎(chǔ)上,端側(cè)算力未來會快速提升。二是模型正在不斷演變,例如混合專家模型(MoE)正受到業(yè)內(nèi)人士的關(guān)注。三是人們越來越關(guān)注安全性,端側(cè)模型對于個人安全隱私,以及端之間互聯(lián)互通的安全性有很好地保護。四是大模型開始垂直化整合,垂直領(lǐng)域端+小模型的需求也在提升,王吉平認為小模型和小終端之間也可以非常完美地匹配。

目前,在終端產(chǎn)品中,PC、智能家居、車載設(shè)備、智能手機、智能手表、耳機,甚至是AR/VR等設(shè)備都能得到AI技術(shù)的加持。

可以預(yù)測到,隨著場景化發(fā)展,不同場景下的終端分工更加細致和專業(yè),AI技術(shù)將加速終端未來十年新一輪的融合。

目前,手機廠商已經(jīng)打造了各自的AI大模型,將其賦能至智能手機中,例如華為小藝語音助手用到了盤古大模型,小米小愛同學(xué)用的是小米AI大模型MiLM-6B等等。

在AI PC方面,已經(jīng)從普通的AI PC走向了AI PC智能體,例如聯(lián)想于4月18日發(fā)布的業(yè)內(nèi)首款A(yù)I PC個人智能體——聯(lián)想小天,具備文生圖的功能,還能實現(xiàn)圖像訓(xùn)練和深度編輯。
圖源:聯(lián)想

在AI機器人方面,傳音旗下創(chuàng)新科技品牌TECNO在MWC24上,展示了公司首款A(yù)I增強型仿生四足機器人Dynamic 1,能夠用于智能助手、教育培訓(xùn)等場景。

AI終端在發(fā)展過程中,大模型(LLM)向智能體(Agent)轉(zhuǎn)變,最終形成一個完整的閉環(huán)。那么,未來AI終端會朝著哪些方向發(fā)展呢?業(yè)內(nèi)人士普遍認為,未來AI終端將成為個人AI助理,IDC認為將具備以下五大特征:

一是成為第一交互入口。此外,當國內(nèi)的推理芯片搭載在各個終端后,會形成國內(nèi)生態(tài)的智能體應(yīng)用于各個行業(yè)中。二是終端將標配本地混合AI算力,例如CPU/NPU/GPU等;隨之,形成個人終端和個人邊緣協(xié)同計算結(jié)構(gòu)。三是終端內(nèi)嵌個人大模型,形成個性化本地知識庫。四是必須會有個人數(shù)據(jù)和隱私安全保護。五是有一個連接開放的AI應(yīng)用生態(tài),同時它要開發(fā)API接口



AI芯片進入新的競爭階段,英偉達英特爾、高通攻克推理性能
在技術(shù)底層,AI終端的發(fā)展離不開AI芯片。隨著AI大模型在終端進行規(guī)?;瘮U張,部署端側(cè)算力顯得尤為重要。英特爾CEO帕特·基辛格曾表示在人工智能領(lǐng)域,推理技術(shù)變得越來越重要,甚至比訓(xùn)練還更加重要。

IDC中國及全球副總裁王吉平也預(yù)測了大語言模型端側(cè)芯片的發(fā)展趨勢,他認為XPU模式會推動端側(cè)模型推理能力明顯提升。
圖源:電子發(fā)燒友網(wǎng)攝

目前,在AI芯片領(lǐng)域,英偉達、英特爾、AMD等是國際主流玩家。在近兩年,國內(nèi)的推理芯片廠商也逐漸進入業(yè)內(nèi)視野中,例如阿里平頭哥、寒武紀、燧原科技、云天勵飛等,隨著技術(shù)的迭代,上述國產(chǎn)芯片廠商的AI芯片性能也在不斷提升。

AI芯片領(lǐng)域的競爭進入了新的階段。目前,英特爾、英偉達、高通都推出了各自面向AI推理的芯片。

就在美國時間4月9日,英特爾發(fā)布了新一代AI芯片Gaudi 3,可對標英偉達H100。Gaudi 3采用5nm工藝制造,具有64個第五代張量處理核心、8個矩陣計算引擎,24個200 Gbps以太網(wǎng) RDMA NIC,以太網(wǎng)的通用標準能連接數(shù)萬個加速器,最高 16 條 PCIe 5.0 總線。與Gaudi 2相比,Gaudi 3的FP8吞吐量達到1835 TFLOPS,BF16性能提升四倍,網(wǎng)絡(luò)帶寬提升兩倍,內(nèi)存帶寬提升1.5倍。

英偉達H100芯片是在2023年發(fā)布的產(chǎn)品,采用4nm工藝,搭載了最新Hopper架構(gòu),集成Transformer引擎、第四代TensorCore、第四代張量內(nèi)核等技術(shù)。支持PCle Gen5和利用HBM3,憶體頻寬達到3TB/s,F(xiàn)P8 算力與A100相比提升了3倍,達4000TFLOPS。

在今年3月的英偉達GTC人工智能大會,英偉達還發(fā)布了Blackwell B200 GPU,有著2080億個晶體管,H100的FP4性能為4 petaflops,而B200 能提供高達20 petaflops FP4的算力。兩個B200與單個英偉達Grace CPU相連,打造出GB200 Grace Blackwell超級芯片。

在AI芯片新的競爭階段,廠商都更加重視芯片的推理能力,從英特爾和英偉達的新品正好說明了這一點。英特爾Gaudi系列面向AI應(yīng)用場景,其推理能力也在不斷提升,Gaudi 3的模型訓(xùn)練速度提升40%,推理速度則提升50%。

英偉達介紹,H100采用了新的Transformer Engine專門用于加速Transformer 模型的訓(xùn)練和推理,在進行語言模型的訓(xùn)練和推理時,訓(xùn)練速度是A100的9倍,推理速度是A100的30倍。Blackwell GPU更是能提供30倍的推理性能,AI訓(xùn)練和大模型實時推理的規(guī)模擴展到10萬億參數(shù)。

高通也在2023年10月發(fā)布驍龍 X Elite,這是一款面向 Windows 11 PC 的旗艦 PC 芯片,集成了Oryon?CPU、Adreno?GPU、Hexagon?NPU,支持在端側(cè)運行超過 130 億參數(shù)的生成式 AI 模型。

在當時的發(fā)布會上,高通透露搭載驍龍 X Elite 芯片的筆記本電腦在今年中期面世。近期已有消息顯示,聯(lián)想 YOGA Slim 7 14 2024 驍龍版,以及一款命名為ThinkPad T14s Gen 6 驍龍版的筆記本或?qū)⒋钶d高通驍龍X Elite 芯片。高通驍龍X Elite 芯片會給聯(lián)想AI PC帶來哪些AI性能,值得期待。

而英偉達的H100已經(jīng)應(yīng)用在其超級計算機Eos中,總共搭載了4608個H100 GPU,還有1,152個英特爾至強Platinum 8480C處理器。Eos被認為是英偉達速度最快的人工智能超級計算機,可用于人工智能和高性能計算工作負載。

每一代AI芯片的推出,都有它各自的應(yīng)用定位。從終端市場來看,AI技術(shù)已經(jīng)從手機、PC滲透進更多終端產(chǎn)品,未來會走向高性能PC、工作站等,不管是面向TO C,還是TO B的行業(yè)場景(服務(wù)業(yè)、制造業(yè)等),所需要的算力將隨著應(yīng)用需求逐步提升,也會提高推理芯片的要求。未來推理芯片在AI終端會迎來怎么樣的發(fā)展,又會提升哪些應(yīng)用體驗,值得期待。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31504

    瀏覽量

    270302
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1903

    瀏覽量

    35213
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1012

    瀏覽量

    14954
  • AI PC
    +關(guān)注

    關(guān)注

    0

    文章

    124

    瀏覽量

    283
收藏 人收藏

    評論

    相關(guān)推薦

    英國政府計劃大幅提升AI

    近日,英國首相斯塔默宣布了一項雄心勃勃的計劃,承諾到2030年,英國政府將采購多達10萬塊圖形處理器(GPU),以大幅提升英國的AI水平。 據(jù)悉,這一舉措旨在將英國主權(quán)
    的頭像 發(fā)表于 01-14 14:18 ?172次閱讀

    廣和通Fibocom AI Stack:加速側(cè)AI部署新紀元

    、海量模型以及全方位的支持與服務(wù)于一體,為智能設(shè)備提供了AI解決方案。為適應(yīng)多樣化的側(cè)應(yīng)用場景,
    的頭像 發(fā)表于 01-13 11:32 ?358次閱讀

    廣和通發(fā)布Fibocom AI Stack,助力客戶快速實現(xiàn)跨平臺跨系統(tǒng)的側(cè)AI部署

    模型及行業(yè)側(cè)模型,基于不同等級芯片平臺或模組,F(xiàn)ibocom AI Stack可將Ten
    發(fā)表于 01-08 11:38 ?93次閱讀
    廣和通發(fā)布Fibocom <b class='flag-5'>AI</b> Stack,助力客戶<b class='flag-5'>快速</b>實現(xiàn)跨平臺跨系統(tǒng)的<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>部署

    廣和通開啟側(cè)AI時代

    AI發(fā)展正酣,隨著終端芯片越來越高、側(cè)模型能力
    的頭像 發(fā)表于 12-12 10:35 ?300次閱讀

    AI風(fēng)向標|與通信的完美融合,SRM6690解鎖側(cè)AI的智能密碼

    當前,5G技術(shù)已經(jīng)成為推動數(shù)字經(jīng)濟和實體經(jīng)濟深度融合的關(guān)鍵驅(qū)動力,進入5G發(fā)展的下半場,5G與AI的融合正推動諸多行業(yè)的數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展,終端側(cè)
    的頭像 發(fā)表于 11-15 01:01 ?271次閱讀
    <b class='flag-5'>AI</b>風(fēng)向標|<b class='flag-5'>算</b><b class='flag-5'>力</b>與通信的完美融合,SRM6690解鎖<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>的智能密碼

    AI風(fēng)向標 與通信的完美融合,SRM6690解鎖側(cè)AI的智能密碼

    當前,5G技術(shù)已經(jīng)成為推動數(shù)字經(jīng)濟和實體經(jīng)濟深度融合的關(guān)鍵驅(qū)動力,進入5G發(fā)展的下半場,5G與AI的融合正推動諸多行業(yè)的數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展,終端側(cè)
    的頭像 發(fā)表于 11-14 17:19 ?306次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?1133次閱讀

    側(cè)AI浪潮已來!炬芯科技發(fā)布新一代側(cè)AI音頻芯片,能效比和AI大幅度提升

    電子發(fā)燒友原創(chuàng) 章鷹 ? 11月5日,在深圳會展中心7號館內(nèi),炬芯科技董事長兼CEO周正宇博士帶來了《側(cè)AI芯片的未來》演講,他對
    的頭像 發(fā)表于 11-06 09:11 ?2907次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>浪潮已來!炬芯科技發(fā)布新一代<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>音頻<b class='flag-5'>芯片</b>,能效比和<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>大幅度<b class='flag-5'>提升</b>

    廣和通側(cè)AI解決方案驅(qū)動性能密集型場景商用型場景商用

    2024世界機器人大會期間,廣和通宣布:基于高通QCS8550平臺的廣和通側(cè)AI解決方案高效使能性能密集型場景。該側(cè)
    的頭像 發(fā)表于 08-23 16:05 ?722次閱讀
    廣和通<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>解決方案驅(qū)動性能密集型場景商用型場景商用

    大模型時代需求

    現(xiàn)在AI進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問
    發(fā)表于 08-20 09:04

    廣和通發(fā)布基于高通 QCM6490和QCS8550處理器的側(cè)AI解決方案

    、高力推動移動機器人、工業(yè)機器視覺、智慧零售、自動駕駛等領(lǐng)域智能化。 ? 相較于云側(cè)AI,側(cè)AI
    的頭像 發(fā)表于 06-07 16:44 ?1077次閱讀

    通義千問首次落地天璣9300移動平臺!阿里云攜手MediaTek探索側(cè)AI智能體

    ,實現(xiàn)手機AI體驗的大幅提升。這是通義大模型首次完成芯片級的軟硬適配,僅依靠終端便能擁有極佳
    發(fā)表于 03-28 10:51 ?312次閱讀
    通義千問首次落地天璣9300移動平臺!阿里云攜手MediaTek探索<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>智能體

    一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放AI時代

    華為中國合作伙伴大會 | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò),以網(wǎng)強,全面釋放AI時代
    的頭像 發(fā)表于 03-22 10:28 ?826次閱讀
    一圖看懂星河<b class='flag-5'>AI</b>數(shù)據(jù)中心網(wǎng)絡(luò),全面釋放<b class='flag-5'>AI</b><b class='flag-5'>時代</b><b class='flag-5'>算</b><b class='flag-5'>力</b>

    時代, 如何打破內(nèi)存墻

    設(shè)計的不斷革新,進入了大時代。 目前,主流AI芯片的架構(gòu)仍然沿用了傳統(tǒng)的馮·諾依曼模型,這一
    的頭像 發(fā)表于 03-06 19:51 ?351次閱讀
    大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>時代</b>, 如何打破內(nèi)存墻

    榮耀引領(lǐng)側(cè)AI時代

    在今年的MWC盛會上,榮耀宣布與高通、Meta攜手,將70億參數(shù)大模型引入側(cè),這一創(chuàng)新舉措預(yù)示著側(cè)AI
    的頭像 發(fā)表于 03-01 10:28 ?699次閱讀
    大发888棋牌下载| 赌百家乐官网的方法| 石台县| 怎样看百家乐官网牌| 菲律宾百家乐官网太阳城| 湟中县| 穆棱市| 百家乐官网视频游戏挖坑| 电子百家乐官网作假| 百家乐赌坊| 太阳百家乐娱乐| 百家乐国际娱乐平台| 百家乐最安全打法| 大发888 现金棋牌游戏| 巴马| 代理百家乐官网试玩| 百家乐游戏源码手机| 亚洲顶级赌场 塑造品牌神话| 大发888 登陆不上| 凤庆县| 永利百家乐官网娱乐平台| 百家乐免费下| 汉川市| 24山方位| 大发888战神娱乐| 上市百家乐官网评论| 网上百家乐官网好玩吗| 百家乐视频大厅| 鼎丰娱乐城开户| 百家乐官网投注方法投资法| 赌博百家乐经验| 大发888casino| 百家乐官网双龙出| 金三角百家乐官网的玩法技巧和规则 | 百家乐官网视频下载地址| 百家乐园百利宫娱乐城怎么样百家乐园百利宫娱乐城如何 | 乐百家乐彩现金开户| 皇冠网hg3155| 百家乐真钱棋牌| 阿坝| 澳门百家乐哪家信誉最好|