吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于移動設(shè)備的框架TensorFlow Lite發(fā)布重大更新

jmiy_worldofai ? 來源:lq ? 2019-01-21 13:45 ? 次閱讀

TensorFlow用于移動設(shè)備的框架TensorFlow Lite發(fā)布重大更新,支持開發(fā)者使用手機等移動設(shè)備的GPU來提高模型推斷速度。

在進行人臉輪廓檢測的推斷速度上,與之前使用CPU相比,使用新的GPU后端有不小的提升。在Pixel 3和三星S9上,提升程度大概為4倍,在iPhone 7上有大約有6倍。

為什么要支持GPU?

眾所周知,使用計算密集的機器學(xué)習(xí)模型進行推斷需要大量的資源。

但是移動設(shè)備的處理能力和功率都有限。雖然TensorFlow Lite提供了不少的加速途徑,比如將機器學(xué)習(xí)模型轉(zhuǎn)換成定點模型,但總是會在模型的性能或精度上做出讓步。

而將GPU作為加速原始浮點模型的一種選擇,不會增加量化的額外復(fù)雜性和潛在的精度損失。

在谷歌內(nèi)部,幾個月來一直在產(chǎn)品中使用GPU后端做測試。結(jié)果證明,的確可以加快復(fù)雜網(wǎng)絡(luò)的推斷速度。

在Pixel 3的人像模式(Portrait mode)中,與使用CPU相比,使用GPU的Tensorflow Lite,用于摳圖/背景虛化的前景-背景分隔模型加速了4倍以上。新深度估計(depth estimation)模型加速了10倍以上。

在能夠為視頻增加文字、濾鏡等特效的YouTube Stories和谷歌的相機AR功能Playground Stickers中,實時視頻分割模型在各種手機上的速度提高了5-10倍。

對于不同的深度神經(jīng)網(wǎng)絡(luò)模型,使用新GPU后端,通常比浮點CPU快2-7倍。對4個公開模型和2個谷歌內(nèi)部模型進行基準(zhǔn)測試的效果如下:

使用GPU加速,對于更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型最為重要,比如密集的預(yù)測/分割或分類任務(wù)。

在相對較小的模型上,加速的效果就沒有那么明顯了,使用CPU反而有利于避免內(nèi)存?zhèn)鬏斨泄逃械难舆t成本。

如何使用?

安卓設(shè)備(用Java)中,谷歌已經(jīng)發(fā)布了完整的Android Archive (AAR) ,其中包括帶有GPU后端的TensorFlow Lite。

你可以編輯Gradle文件,用AAR替代當(dāng)前的版本,并將下面的代碼片段,添加到Java初始化代碼中。

//InitializeinterpreterwithGPUdelegate.GpuDelegatedelegate=newGpuDelegate();Interpreter.Optionsoptions=(newInterpreter.Options()).addDelegate(delegate);Interpreterinterpreter=newInterpreter(model,options);//Runinference.while(true){writeToInputTensor(inputTensor);interpreter.run(inputTensor,outputTensor);readFromOutputTensor(outputTensor);}//Cleanup.delegate.close();在iOS設(shè)備(用C++)中,要先下載二進制版本的TensorFlowLite。然后更改代碼,在創(chuàng)建模型后調(diào)用ModifyGraphWithDelegate()。//InitializeinterpreterwithGPUdelegate.std::unique_ptrinterpreter;InterpreterBuilder(model,op_resolver)(&interpreter);auto*delegate=NewGpuDelegate(nullptr);//defaultconfigif(interpreter->ModifyGraphWithDelegate(delegate)!=kTfLiteOk)returnfalse;//Runinference.while(true){WriteToInputTensor(interpreter->typed_input_tensor(0));if(interpreter->Invoke()!=kTfLiteOk)returnfalse;ReadFromOutputTensor(interpreter->typed_output_tensor(0));}//Cleanup.interpreter=nullptr;DeleteGpuDelegate(delegate);

(更多的使用教程,可以參見TensorFlow的官方教程,傳送門在文末)

還在發(fā)展中

當(dāng)前發(fā)布的,只是TensorFlow Lite的開發(fā)者預(yù)覽版。

新的GPU后端,在安卓設(shè)備上利用的是OpenGL ES 3.1 Compute Shaders,在iOS上利用的是Metal Compute Shaders。

能夠支持的GPU操作并不多。有:

ADD v1、AVERAGE_POOL_2D v1、CONCATENATION v1、CONV_2D v1、DEPTHWISE_CONV_2D v1-2、FULLY_CONNECTED v1、LOGISTIC v1

MAX_POOL_2D v1、MUL v1、PAD v1、PRELU v1、RELU v1、RELU6 v1、RESHAPE v1、RESIZE_BILINEAR v1、SOFTMAX v1、STRIDED_SLICE v1、SUB v1、TRANSPOSE_CONV v1

TensorFlow官方表示,未來將會擴大操作范圍、進一步優(yōu)化性能、發(fā)展并最終確定API。

完整的開源版本,將會在2019年晚些時候發(fā)布。

傳送門

使用教程:

https://www.tensorflow.org/lite/performance/gpu

項目完整文檔:

https://www.tensorflow.org/lite/performance/gpu_advanced

博客地址:

https://medium.com/tensorflow/tensorflow-lite-now-faster-with-mobile-gpus-developer-preview-e15797e6dee7

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10903

    瀏覽量

    213018
  • 移動設(shè)備
    +關(guān)注

    關(guān)注

    0

    文章

    506

    瀏覽量

    54824
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    329

    瀏覽量

    60631
  • TensorFlow Lite
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    647

原文標(biāo)題:TensorFlow Lite發(fā)布重大更新!支持移動GPU、推斷速度提升4-6倍

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    EE-217:更新ADSP-TS101S TigerSHARC EZ-KIT Lite固件

    電子發(fā)燒友網(wǎng)站提供《EE-217:更新ADSP-TS101S TigerSHARC EZ-KIT Lite固件.pdf》資料免費下載
    發(fā)表于 01-14 16:39 ?0次下載
    EE-217:<b class='flag-5'>更新</b>ADSP-TS101S TigerSHARC EZ-KIT <b class='flag-5'>Lite</b>固件

    迅為RK3576開發(fā)板適用于ARM PC、邊緣計算、個人移動互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品

    計算、個人移動互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品。 支持INT4/INT8/INT16/FP16/BF16/TF32混合運算,并憑借其強大的兼容性,可以輕松轉(zhuǎn)換基于TensorFlow、MXNet
    發(fā)表于 12-27 14:18

    卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)工具與框架

    TensorFlow是由Google Brain團隊開發(fā)的開源機器學(xué)習(xí)框架,它支持多種深度學(xué)習(xí)模型的構(gòu)建和訓(xùn)練,包括卷積神經(jīng)網(wǎng)絡(luò)。TensorFlow以其靈活性和可擴展性而聞名,適用于
    的頭像 發(fā)表于 11-15 15:20 ?328次閱讀

    第四章:在 PC 交叉編譯 aarch64 的 tensorflow 開發(fā)環(huán)境并測試

    本文介紹了在 PC 端交叉編譯 aarch64 平臺的 tensorflow 庫而非 tensorflow lite 的心酸過程。
    的頭像 發(fā)表于 08-25 11:38 ?1364次閱讀
    第四章:在 PC 交叉編譯 aarch64 的 <b class='flag-5'>tensorflow</b> 開發(fā)環(huán)境并測試

    降低物聯(lián)網(wǎng)開發(fā)門檻的TuyaOS重磅更新:AI賦能設(shè)備升級,配網(wǎng)速度10倍提升

    作為降低智能解決方案開發(fā)門檻的 TuyaOS 操作系統(tǒng),此次又迎來了重大更新(點擊查看 TuyaOS 完整介紹)! 本次 TuyaOS 3.10.0 版本發(fā)布了超豐富的開發(fā)框架,覆蓋多
    的頭像 發(fā)表于 07-22 11:47 ?353次閱讀
    降低物聯(lián)網(wǎng)開發(fā)門檻的TuyaOS重磅<b class='flag-5'>更新</b>:AI賦能<b class='flag-5'>設(shè)備</b>升級,配網(wǎng)速度10倍提升

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)的一個開源深度學(xué)習(xí)框架,它允許開發(fā)者方便地構(gòu)建、訓(xùn)練和部署各種復(fù)雜的機器學(xué)習(xí)模型。TensorFlow憑借其高效的計算性能、靈活的架構(gòu)以及豐富的工具和庫,在學(xué)
    的頭像 發(fā)表于 07-12 16:38 ?810次閱讀

    使用TensorFlow進行神經(jīng)網(wǎng)絡(luò)模型更新

    使用TensorFlow進行神經(jīng)網(wǎng)絡(luò)模型的更新是一個涉及多個步驟的過程,包括模型定義、訓(xùn)練、評估以及根據(jù)新數(shù)據(jù)或需求進行模型微調(diào)(Fine-tuning)或重新訓(xùn)練。下面我將詳細闡述這個過程,并附上相應(yīng)的TensorFlow代碼
    的頭像 發(fā)表于 07-12 11:51 ?488次閱讀

    bootstrap框架和vue框架的區(qū)別

    響應(yīng)式移動優(yōu)先的網(wǎng)頁。Bootstrap的核心設(shè)計理念是“移動優(yōu)先”,即優(yōu)先考慮移動設(shè)備的顯示效果,然后通過媒體查詢等技術(shù)實現(xiàn)對不同設(shè)備的適
    的頭像 發(fā)表于 07-11 09:55 ?984次閱讀

    bootstrap框架用什么軟件開發(fā)

    Bootstrap是一個流行的前端框架用于快速開發(fā)響應(yīng)式和移動優(yōu)先的Web應(yīng)用程序。它提供了一套預(yù)定義的CSS和JavaScript組件,使得開發(fā)者可以快速構(gòu)建出漂亮的用戶界面
    的頭像 發(fā)表于 07-11 09:50 ?589次閱讀

    tensorflow和pytorch哪個更簡單?

    TensorFlow和PyTorch都是用于深度學(xué)習(xí)和機器學(xué)習(xí)的開源框架TensorFlow由Google Brain團隊開發(fā),而PyTorch由Facebook的AI研究團隊開
    的頭像 發(fā)表于 07-05 09:45 ?977次閱讀

    tensorflow和pytorch哪個好

    tensorflow和pytorch都是非常不錯的強大的框架TensorFlow還是PyTorch哪個更好取決于您的具體需求,以下是關(guān)于這兩個框架的一些關(guān)鍵點:
    的頭像 發(fā)表于 07-05 09:42 ?772次閱讀

    keras模型轉(zhuǎn)tensorflow session

    和訓(xùn)練深度學(xué)習(xí)模型。Keras是基于TensorFlow、Theano或CNTK等底層計算框架構(gòu)建的。TensorFlow是一個開源的機器學(xué)習(xí)框架,由Google Brain團隊開發(fā)。
    的頭像 發(fā)表于 07-05 09:36 ?594次閱讀

    TensorFlow與PyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的一個重要分支,在過去十年中取得了顯著的進展。在構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的過程中,深度學(xué)習(xí)框架扮演著至關(guān)重要的角色。TensorFlow和PyTorch是目前最受歡迎的兩大深度
    的頭像 發(fā)表于 07-02 14:04 ?1075次閱讀

    多地發(fā)布設(shè)備更新“白名單”,儀器采購一觸即發(fā)

    近日,多地發(fā)布設(shè)備更新服務(wù)機構(gòu)、優(yōu)勢企業(yè)及產(chǎn)品的白名單,諸多儀器設(shè)備企業(yè)上榜,成為需求方設(shè)備更新
    的頭像 發(fā)表于 05-23 09:10 ?491次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlowTensorFlow是一個開源的機器學(xué)
    的頭像 發(fā)表于 03-01 16:25 ?966次閱讀
    百家乐太阳城线上| 百家乐tt娱乐场| 百家乐必胜打| 美乐门娱乐| 网络百家乐官网金海岸破解软件| 网上百家乐玩法| 联合百家乐的玩法技巧和规则| 娱乐城送体验金| 百家乐官网网站源码| 虚拟百家乐游戏下载| 大发888官方6222.com| 百家乐官网有真假宝单吗| 24山在风水中的作用| 名人百家乐官网的玩法技巧和规则| 新锦江百家乐的玩法技巧和规则| 足球竞猜网| 百家乐官网桌布尼布材质| 皇冠百家乐客户端皇冠| 六合彩130| 百家乐官网真人娱乐场开户注册| 七胜百家乐娱乐网| 辉县市| 百家乐案件讯问| bet365备用主页| 游戏机百家乐官网庄闲| 万人迷百家乐的玩法技巧和规则| 百家乐官网游戏群号| 百家乐浴盆博彩通排名| 爱博| 百家乐打水策略| 太阳城娱乐城怎么样| 24山可以正针吗| 娱乐城注册送钱| 御匾会百家乐官网娱乐城| 全讯网qx1860.com| 最大的百家乐官网网站| 博彩百家乐的玩法技巧和规则| 娱乐城百家乐官网高手| 百家乐赌场代理荐| 百家乐官网单双打法| 长方形百家乐筹码|