吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

邊緣AI推理應用設計的發展

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Geoff Tate ? 2022-07-10 10:03 ? 次閱讀

在過去的三四年里,人工智能推理市場發生了巨大變化。以前,甚至不存在邊緣人工智能,大多數推理能力都發生在數據中心、超級計算機或政府應用程序中,這些應用程序通常也是大型計算項目。在所有這些情況下,性能都是至關重要的,并且始終是重中之重。快進到今天,邊緣人工智能市場與此截然不同,尤其是當它進入更多商業應用時。對于這些用例,主要關注點更多的是低成本、功耗和小尺寸;而更少關于原始性能。

通過硬件-軟件協同設計平衡更好的性能

在查看推理芯片時,很明顯一種芯片與另一種不同。設計師總是在他們的設計中做出選擇,而好的選擇會考慮他們的最終應用以及他們在這些應用中的限制。例如,當 Flex Logix 設計其第一個推理芯片時,它最初的大小是現在的 4 倍。我們很快意識到,芯片需要更小才能在成本更低、功耗更低、外形尺寸更小的邊緣 AI 市場中占據一席之地。

有趣的是,大多數人最初認為大多數推理總是在數據中心完成。這種觀點最終發生了變化,因為行業意識到它有太多的數據需要移動,因此,這些數據開始向邊緣移動。隨著 5G 開始出現,更清楚的是,不可能始終將原始數據發送到云端進行處理。顯然,邊緣必須有一定的智能才能解決 99.9% 的場景,而數據中心實際上只需要用于極端情況。一個完美的例子是安全攝像頭。邊緣 AI 需要能夠確定是否發生了任何可疑活動以及周圍是否有人。然后,如果發現任何有趣的東西,這些部分可以發送到數據中心進行進一步處理。然而,發送到數據中心的數據實際上只是整體推理的一小部分。邊緣推理 AI 通常意味著要滿足很多約束,有時如果你想運行非常大的復雜模型,你實際上只需要在很小一部分數據上運行這些模型。

早期邊緣 AI 推理設計的另一個誤解是,一刀切的方法就足夠了。這也被證明是錯誤的,因為出現了展示其優勢和力量的專用芯片。關鍵是圍繞算法構建芯片,因為如果它真的能在算法上磨練,你可以獲得更好的性能。正確的平衡實際上是像專用硬件一樣獲得最有效的計算,但在編譯時具有可編程性。

可編程性是關鍵

該行業確實處于人工智能發展的風口浪尖。在接下來的幾十年里,我們將在這個領域看到的創新將是驚人的。就像任何長壽的市場一樣,您可以期待變化。這就是為什么不為某些客戶模型設計超級專業的芯片變得至關重要的原因。如果我們今天這樣做,那么當芯片在兩年后到達客戶手中時,模型可能會發生重大變化——客戶的要求也會發生變化。這就是我們不斷聽到有關公司最終獲得他們的人工智能推理芯片的故事的主要原因——然后發現它們的表現并沒有像他們需要的那樣。如果將可編程性內置到芯片架構中,則可以輕松解決該問題。

如今,在任何邊緣 AI 處理器中,AI 的靈活性和可編程性都至關重要。客戶的算法會定期發生變化,系統設計也會發生變化。隨著 Edge AI 功能在主流中的推廣,越來越清楚的是,芯片設計人員需要能夠適應和改變客戶模型,而不是根據他們“認為”的模型來選擇它。我們一次又一次地看到這一點,這就是編譯器如此重要的原因。編譯器中有很多對最終用戶隱藏的技術,這些技術是圍繞分配資源以確保一切都以最少的功率高效完成的。

另一個被密切關注的關鍵特性是吞吐量。現在正在構建好的推理芯片,以便它們可以非常快速地通過它們移動數據,這意味著它們必須非常快速地處理這些數據,并且非常快速地將其移入和移出內存。通常,芯片供應商會拋出各種各樣的性能數據,例如 TOPS 或 ResNet-50,但研究這些數據的系統/芯片設計人員很快就會意識到這些數據通常毫無意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過程以及 PVT(過程/電壓/溫度)條件提供多少吞吐量。這是衡量其性能表現的第一個衡量標準,但令人驚訝的是,很少有供應商提供它。

邊緣人工智能向前發展

今天的許多客戶都渴望吞吐量,并正在尋找能夠以與他們現在使用的相同功率/價格為他們提供更高吞吐量和更大圖像尺寸的解決方案。當他們得到它時,他們的解決方案將比競爭解決方案更準確和可靠,然后他們的市場采用和擴展將加速。因此,盡管今天的應用程序有數千或數萬個單位,但我們預計隨著推理的可用性,這種情況會迅速增長,從而提供越來越多的吞吐量/美元和吞吐量/瓦特。

邊緣人工智能市場正在迅速增長,芯片供應商也在這個市場上爭奪一席之地。事實上,到 2020 年代中期,人工智能銷售額迅速增長至數百億美元,其中大部分增長來自邊緣人工智能推理。沒有人可以預測未來的模型,這就是為什么在設計時考慮到靈活性和可編程性更為重要

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19409

    瀏覽量

    231201
  • 芯片
    +關注

    關注

    456

    文章

    51192

    瀏覽量

    427320
  • AI
    AI
    +關注

    關注

    87

    文章

    31536

    瀏覽量

    270351
收藏 人收藏

    評論

    相關推薦

    生成式AI推理技術、市場與未來

    (reasoning)能力,這一轉變將極大推動上層應用的發展。 紅杉資本近期指出,在可預見的未來,邏輯推理推理時計算將是一個重要主題,并開啟生成式AI的下一階段。新一輪競賽已然開始。
    的頭像 發表于 01-20 11:16 ?430次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術、市場與未來

    新品| LLM630 Compute Kit,AI 大語言模型推理開發平臺

    LLM630LLM推理,視覺識別,可開發,靈活擴展···LLM630ComputeKit是一款AI大語言模型推理開發平臺,專為邊緣計算和智能交互應用而設計。該套件的主板搭載愛芯AX63
    的頭像 發表于 01-17 18:48 ?145次閱讀
    新品| LLM630 Compute Kit,<b class='flag-5'>AI</b> 大語言模型<b class='flag-5'>推理</b>開發平臺

    邊緣計算的未來發展趨勢

    邊緣計算的未來發展趨勢呈現出多元化和高速增長的態勢,以下是對其未來發展趨勢的分析: 一、技術融合與創新 與5G、AI技術的深度融合 隨著5G技術的普及,其大帶寬、低延遲的特性為
    的頭像 發表于 10-24 14:21 ?1115次閱讀

    李開復:中國擅長打造經濟實惠的AI推理引擎

    10月22日上午,零一萬物公司的創始人兼首席執行官李開復在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實現了顯著優勢,比OpenAI的GPT-4o模型低了31倍。他強調,中國擅長打造經濟實惠的AI
    的頭像 發表于 10-22 16:54 ?414次閱讀

    AMD分析嵌入式邊緣AI發展

    隨著人工智能( AI )技術廣泛應用于各行各業,從云到邊緣的解決方案逐漸成為信息技術領域新的熱點。嵌入式邊緣 AI 在當今的各種邊緣應用中能
    的頭像 發表于 09-18 09:30 ?374次閱讀
    AMD分析嵌入式<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>的<b class='flag-5'>發展</b>

    什么是邊緣AI邊緣AI的供電挑戰

    RECOM 的 RACM1200-V 采用數字通信,可輕松集成到邊緣 AI設計中。
    的頭像 發表于 09-02 11:52 ?553次閱讀
    什么是<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>?<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>的供電挑戰

    Imagination 引領邊緣計算和AI創新,擁抱AI未來發展

    6月25日,2024“N+”AI互動創新論壇在南京舉辦,Imagination中國資深副總裁張曉波受邀出席。在主題演講中,張曉波表示,Imagination作為圖形、計算和邊緣人工智能領域的領導者
    的頭像 發表于 06-28 08:28 ?592次閱讀
    Imagination 引領<b class='flag-5'>邊緣</b>計算和<b class='flag-5'>AI</b>創新,擁抱<b class='flag-5'>AI</b>未來<b class='flag-5'>發展</b>

    邊緣AI需求爆發,邊緣計算網關亟待革新

    電子發燒友網報道(文/吳子鵬)根據《全球與中國邊緣AI芯片市場競爭建議及發展狀況調研報告2024-2030》,2023年全球邊緣AI芯片市場
    的頭像 發表于 06-20 01:04 ?2806次閱讀

    MediaTek與NVIDIA TAO加速物聯網邊緣AI應用發展

    在即將到來的COMPUTEX 2024科技盛會上,全球知名的芯片制造商MediaTek宣布了一項重要合作——將NVIDIA的TAO(TensorRT Accelerated Optimizer)與其NeuroPilot SDK(軟件開發工具包)集成,共同推動邊緣AI
    的頭像 發表于 06-12 14:49 ?516次閱讀

    如何基于OrangePi?AIpro開發AI推理應

    。通過昇騰CANN軟件棧的AI編程接口,可滿足大多數AI算法原型驗證、推理應用開發的需求。AscendCL(AscendComputingLanguage,昇騰計算
    的頭像 發表于 06-04 14:23 ?601次閱讀
    如何基于OrangePi?AIpro開發<b class='flag-5'>AI</b><b class='flag-5'>推理應</b>用

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計算盒子詳解

    近年來,隨著人工智能和邊緣計算的發展,一種名為AI邊緣盒子的新型設備正逐漸引起廣泛關注。作為一種集成了邊緣計算和
    的頭像 發表于 05-29 14:24 ?1075次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計算盒子詳解

    邊緣AI芯片提供商超星未來完成數億元 Pre-B輪融資

    AI產業生態中,計算芯片被視為行業的“賣水人”。依據云端/邊緣端、訓練/推理兩大分類標準,AI芯片可劃分為四個類別,其中邊緣
    的頭像 發表于 05-09 09:38 ?609次閱讀

    開發者手機 AI - 目標識別 demo

    識別demo: JS實現UI界面的功能; Native接口及實現主要為JS提供接口進行AI推理。通過Native方式完成推理的前處理、推理以及后處理,這里通過調用opencv、Mind
    發表于 04-11 16:14

    ONNX Runtime支持龍架構,AI推理生態再添新翼

    近日,備受矚目的AI推理框架開源社區ONNX Runtime宣布推出支持龍架構的新版本1.17.0,這一里程碑式的更新意味著龍芯平臺上的AI推理應用開發與部署將更加便捷。
    的頭像 發表于 03-27 10:58 ?794次閱讀

    基于EdgeX+OpenVINO?的邊緣智能融合網關YiFUSION實戰

    邊緣智能需求的大部分客戶已經對AI推理邊緣計算有一定的了解,都希望可以將邊緣數采和AI
    的頭像 發表于 02-29 18:18 ?1332次閱讀
    基于EdgeX+OpenVINO?的<b class='flag-5'>邊緣</b>智能融合網關YiFUSION實戰
    bet365体育在线下载| 百家乐二十一点游戏| 百家乐官网23珠路打法| 百家乐官网赌博策略大全| 网络百家乐| 百家乐视频游戏会员| 百家乐庄闲和游戏机| 百家乐视频游戏平台| 百家乐现金网平台排行榜| 百家乐赌博论谈| 正品百家乐游戏| 英皇百家乐的玩法技巧和规则| 真博百家乐的玩法技巧和规则| 德州百家乐21点桌| 太阳城黑胶三折| 大发888注册 大发888官网| 盈乐博| 百家乐官网摇色子网站| 六合彩教程| 淳安县| 百家乐官网破解版下载| 百家乐官网网站程序| 博必发百家乐官网的玩法技巧和规则 | 红宝石百家乐的玩法技巧和规则 | bet365进不去| 太和县| 足球.百家乐官网投注网出租 | 百家乐好不好| 大发888电子游艺| 涂山国际娱乐城| 百家乐官网大眼仔小路| 淘金百家乐官网的玩法技巧和规则| 乐九百家乐娱乐城| 百家乐赌博在线娱乐| 威尼斯人娱乐城网| 爱拼娱乐场| 百家乐证据| 金牌娱乐城官网| 百家乐官网首选| 任我赢百家乐软件中国有限公司| 麻将二八杠技巧|