吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Kleidi加速AI發(fā)展

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-09-14 09:46 ? 次閱讀

作者:Arm 開發(fā)者平臺副總裁 Geraint North

在持續(xù)快速發(fā)展的人工智能 (AI) 時代,我們堅定地支持全球數(shù)百萬開發(fā)者,確保他們能夠獲得所需的性能、工具和軟件庫,從而順利打造下一波令人驚嘆的 AI 體驗。

為此,我們推出了 Arm Kleidi,這是一項廣泛的軟件和軟件社區(qū)參與計劃,旨在加速 AI 發(fā)展。其中的第一個舉措是推出面向熱門 AI 框架的 Arm Kleidi 軟件庫。這使開發(fā)者可以直接取得 Arm CPU 的出色 AI 功能,而如今全球從云端到邊緣側(cè)的大多數(shù) AI 推理工作負載都在這些 Arm CPU 上運行。開發(fā)者可以借助 Arm 超過 20 年的架構(gòu)創(chuàng)新,從 Armv7 架構(gòu)首次引入高級單指令多數(shù)據(jù) (SIMD) 擴展以支持機器學習 (ML) 工作負載,到如今的 Armv9 架構(gòu)在 Arm CPU 上囊括了加速和保護高級生成式 AI 工作負載的功能,這些創(chuàng)新持續(xù)推動 AI 能力和性能的提升。

Kleidi 軟件庫包含面向 AI 工作負載的 KleidiAI 和面向運行于 Arm CPU 上出色的計算機視覺工作負載的 KleidiCV。該軟件庫可以被直接嵌入到熱門的 AI 框架中,開發(fā)者無需進行任何操作。如此一來,開發(fā)者可以輕松地啟用 Arm CPU 的 AI 功能,從而快速構(gòu)建 AI 應(yīng)用,并在盡可能廣泛的設(shè)備上實現(xiàn)最出色性能。

加速 AI 發(fā)展

為了應(yīng)對設(shè)備類型、神經(jīng)網(wǎng)絡(luò)和推理引擎的爆發(fā)式增長,KleidiAI 是我們所給出的解決方案。它由一系列高度優(yōu)化的 AI 內(nèi)核組成,可在生成式 AI 等用例中實現(xiàn)高性能。KleidiAI 的優(yōu)勢在于,我們不會給開發(fā)者額外增加工作量,而是直接與領(lǐng)先的 AI 框架合作,包括 MediaPipe(通過 XNNPACK)、LLAMA.cpp、PyTorch(通過 ExecuTorch)和 TensorFlow Lite(通過 XNNPACK),以集成 KleidiAI。這不僅加快了開發(fā)流程,并釋放了 AI 性能,為開發(fā)者提供了默認的高性能,使他們能夠順利地打造出色的 AI 體驗。KleidiAI 還提供了前瞻性的兼容性,隨著我們推出更多的技術(shù),這將確保開發(fā)者能夠充分利用未來 AI 加速機會。

KleidiAI 的集成已經(jīng)為生成式 AI 工作負載帶來了顯著的性能提升。與參考實現(xiàn)方案(基于 llama.cpp,但不含我們的軟件 Kleidi 優(yōu)化)相比,在新的 Arm Cortex-X925 CPU 上,使用(集成了 KleidiAI 的)llama.cpp 的 Meta Llama 3 和微軟 Phi-3 大語言模型 (LLM) 的詞元 (Token) 首次響應(yīng)時間加快了 190%。KleidiAI 非常易于集成,Arm 的工程團隊只用不到 24 小時就測出了 Llama 3 的優(yōu)化性能。此外,KleidiAI 還通過 XNNPACK 與 MediaPipe 集成,為在移動設(shè)備上運行的開源 Gemma LLM 提供支持。得益于此,Google Pixel 8 Pro 智能手機上 Gemma 2B 的詞元首次響應(yīng)時間縮短了 25%。

與此同時,我們正在與 Unity 合作開發(fā) Sentis,這是一個端側(cè) AI 推理引擎,可讓游戲開發(fā)者在所有支持 Unity 游戲引擎的設(shè)備上打造創(chuàng)新的 AI 游戲體驗。在集成 KleidAI 后,Unity Sentis 成功啟用了 int4 量化功能,將模型內(nèi)存占用率降低了 72.5%,同時在運行 Phi-2 LLM 時性能提升了 660%。

加速計算機視覺發(fā)展

KleidiCV 能夠加速許多攝像頭用例中的計算機視覺管線。OpenCV 是全球最大的計算機視覺庫,包含 2,500 多種算法,為數(shù)十萬開發(fā)者提供支持。基于 KleidiCV 集成,OpenCV 發(fā)現(xiàn)各種圖像處理任務(wù)的典型性能提升高達 75%。作為我們與 OpenCV 的戰(zhàn)略軟件合作關(guān)系[1]的一部分,我們還首次將安卓構(gòu)建引入 Maven Central,這是一個面向 Java 開發(fā)的開源軟件組件、軟件庫的資源庫。

CPU 上的 AI 優(yōu)勢

Arm Kleidi 專注于加速 CPU 上的 AI 功能,因為在大多數(shù)情況下,所有 AI 工作負載都會從CPU 上開始運行。這使得 CPU 成為開發(fā)者在為其 AI 工作負載設(shè)定目標時的最便捷路徑。因此,我們?yōu)殚_發(fā)者提供的這一路徑性能越出色,他們就更有可能在開發(fā)過程中繼續(xù)使用 CPU 并將其作為目標。此外,隨著 LLM 變得更小更高效,越來越多的 AI 工作負載將適合在 CPU 上處理。最終,開發(fā)過程將變得更加順暢、無縫,進而優(yōu)化開發(fā)者的 AI 工作負載性能。

在 Arm 平臺上構(gòu)建 AI 的未來

Arm Kleidi 的推出再次突顯了 Arm 作為端側(cè)生成式 AI 計算平臺的領(lǐng)先地位。它使開發(fā)者無需學習額外的工具和技能,就能夠在非常廣泛的硬件中獲得 Arm CPU 的出色 AI 性能。隨著我們不斷創(chuàng)新,持續(xù)為新一代 AI 打造前沿架構(gòu),開發(fā)者未來將能夠獲得更強大、更先進的 AI 功能。對于最終用戶來說,這意味著更快速、更智能、更具交互性、更沉浸式、更安全的出色 AI 體驗。

Arm Kleidi 的推出只是一個開端,我們未來還計劃推出更多軟件庫、計算內(nèi)核和引擎集成。我們將持續(xù)在 Arm 平臺上構(gòu)建 AI 的未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9167

    瀏覽量

    369211
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31520

    瀏覽量

    270339
  • 開發(fā)者
    +關(guān)注

    關(guān)注

    1

    文章

    590

    瀏覽量

    17096

原文標題:Arm Kleidi 助力 AI 開發(fā)者加速創(chuàng)新

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Arm平臺引領(lǐng)AI云計算革新

    我們正處于一個由人工智能 (AI) 定義的計算時代,其轉(zhuǎn)型速度空前迅速。Arm 一直致力于通過工程創(chuàng)新和技術(shù)發(fā)展,以可持續(xù)且可擴展的方式加速 AI
    的頭像 發(fā)表于 01-03 15:26 ?314次閱讀

    利用Arm Kleidi技術(shù)實現(xiàn)PyTorch優(yōu)化

    PyTorch 是一個廣泛應(yīng)用的開源機器學習 (ML) 庫。近年來,Arm 與合作伙伴通力協(xié)作,持續(xù)改進 PyTorch 的推理性能。本文將詳細介紹如何利用 Arm Kleidi 技術(shù)提升 A
    的頭像 發(fā)表于 12-23 09:19 ?332次閱讀
    利用<b class='flag-5'>Arm</b> <b class='flag-5'>Kleidi</b>技術(shù)實現(xiàn)PyTorch優(yōu)化

    Arm KleidiAI助力提升PyTorch上LLM推理性能

    熱門的深度學習框架尤為突出,許多企業(yè)均會選擇其作為開發(fā) AI 應(yīng)用的庫。通過部署 Arm Kleidi 技術(shù),Arm 正在努力優(yōu)化 PyTorch,以
    的頭像 發(fā)表于 12-03 17:05 ?927次閱讀
    <b class='flag-5'>Arm</b> KleidiAI助力提升PyTorch上LLM推理性能

    Arm Neoverse如何加速實現(xiàn)AI數(shù)據(jù)中心

    在快速演進的云計算和人工智能 (AI) 時代,企業(yè)需要能助力其優(yōu)化性能、降低成本并在市場競爭中保持領(lǐng)先的方法。Arm Neoverse 已成為眾多前沿企業(yè)的選擇,他們希望在推動創(chuàng)新的同時,能夠顯著
    的頭像 發(fā)表于 11-26 09:30 ?390次閱讀

    Arm推出GitHub平臺AI工具

    專為 GitHub Copilot 設(shè)計的 Arm 擴展程序,可加速從云到邊緣側(cè)基于 Arm 平臺的開發(fā)。
    的頭像 發(fā)表于 11-01 13:50 ?350次閱讀

    Arm推出GitHub平臺AI工具,簡化開發(fā)者AI應(yīng)用開發(fā)部署流程

    專為 GitHub Copilot 設(shè)計的 Arm 擴展程序,可加速從云到邊緣側(cè)基于 Arm 平臺的開發(fā)。 Arm 原生運行器為部署云原生、Windows on
    的頭像 發(fā)表于 10-31 18:51 ?2899次閱讀

    RISC-V在AI領(lǐng)域的發(fā)展前景怎么樣?

    隨著人工智能的不斷發(fā)展,現(xiàn)在的視覺機器人,無人駕駛等智能產(chǎn)品的不斷更新迭代,發(fā)現(xiàn)ARM占用很大的市場份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI領(lǐng)域
    發(fā)表于 10-25 19:13

    RISC-V跑AI算法能加速嗎?

    現(xiàn)在好多ARM單片機都帶機器學習加速,RISC-V有這方面的硬件加速嗎?
    發(fā)表于 10-10 22:14

    Arm KleidiAI軟件庫的功能解析

    推出了 Arm Kleidi,這是一項廣泛的軟件和軟件社區(qū)參與計劃,旨在加速 AI 發(fā)展。其中的第一個舉措是推出面向熱門
    的頭像 發(fā)表于 09-05 15:41 ?541次閱讀
    <b class='flag-5'>Arm</b> KleidiAI軟件庫的功能解析

    Arm發(fā)布全新終端計算子系統(tǒng),加速AI體驗與產(chǎn)品上市

    全球領(lǐng)先的半導體知識產(chǎn)權(quán)(IP)提供商Arm控股有限公司(納斯達克股票代碼:ARM)今日正式推出全新的Arm終端計算子系統(tǒng)(CSS),以推動人工智能(AI)體驗的前沿
    的頭像 發(fā)表于 05-30 14:23 ?628次閱讀

    Arm推出AI優(yōu)化的Arm終端CSS以及新的Arm Kleidi軟件

    Arm 終端計算子系統(tǒng) (CSS) 作為新的計算解決方案,結(jié)合了 Armv9 架構(gòu)的優(yōu)勢,以及基于三納米工藝節(jié)點,經(jīng)過驗證和證實為生產(chǎn)就緒的新 Arm CPU 和 GPU 實現(xiàn),可賦能芯片合作伙伴快速創(chuàng)新,
    的頭像 發(fā)表于 05-30 11:33 ?715次閱讀
    <b class='flag-5'>Arm</b>推出<b class='flag-5'>AI</b>優(yōu)化的<b class='flag-5'>Arm</b>終端CSS以及新的<b class='flag-5'>Arm</b> <b class='flag-5'>Kleidi</b>軟件

    Arm發(fā)布新一代Ethos-U AI加速Arm旨在瞄準國產(chǎn)CPU市場

    Arm發(fā)布的新一代Ethos-U AI加速器確實在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?823次閱讀

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)在嵌入式領(lǐng)域,邊緣與端側(cè)AI推理需求不斷增長,Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計算密集型的 AI 推理算法,也有Ethos 系列 AI
    的頭像 發(fā)表于 04-16 09:10 ?4728次閱讀
    <b class='flag-5'>Arm</b>推動生成式<b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer 架構(gòu),性能提升四倍

    家居智能化,推動AI加速器的發(fā)展

    提高了系統(tǒng)的運算能力和數(shù)據(jù)處理能力,還為用戶帶來了更加智能化、個性化的生活體驗。 ? AI 加速器的發(fā)展 ? 在人工智能和機器學習任務(wù)變得日益復雜和密集之前,傳統(tǒng)的CPU和GPU已經(jīng)足以處理這些任務(wù)。然而,隨著深度學習模型的出現(xiàn)
    的頭像 發(fā)表于 02-23 00:18 ?4685次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))5.FPGA的AI加速源代碼

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發(fā)板。 編寫一個用于AI加速的FPGA程序是一個相當復雜的過程,涉及硬件描述語言(如VHDL或Verilog)以及針對特定
    發(fā)表于 02-12 16:18
    澳门百家乐官网破解方法| 宁国市| 娱网百家乐补丁| 百家乐官网百胜注码法| 信誉棋牌游戏| 百家乐蓝盾有赢钱的吗| 免费百家乐官网的玩法技巧和规则| 高唐县| 大发888金皇冠娱乐城| 百家乐天天乐娱乐场| 迪威百家乐官网娱乐场| 岗巴县| 大发888大发888娱乐城| 玩百家乐输澳门百家乐现场| 百家乐官网真人游戏赌场娱乐网规则| 网络真人赌场| 太阳城娱乐总站| 百家乐太阳城菲律宾| 月华百家乐官网的玩法技巧和规则| 赌百家乐官网赢的奥妙| 皇冠赔率| 大发888娱乐城注册lm0| 破解百家乐游戏机| 大桥下做生意风水好吗| 破解百家乐官网游戏机| 澳门百家乐官网海星王| 海王星线上娱乐| 威尼斯人娱乐场是真的吗| 澳门百家乐介绍| 免费百家乐官网倍投工具| 百家乐官网赌博大全| 易胜博百家乐官网下载| 皇家赌场007| 大发888官方6| 真人百家乐什么平台| 娱乐城百家乐官网的玩法技巧和规则 | 网球比赛比分直播| 大发888官方网站登录| 百家乐单注打| 澳门百家乐心| 百家乐之三姐妹赌博机|