吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TensorFlow發布了一個新的優化工具包,引入post-training模型量化技術

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-10-04 09:16 ? 次閱讀

TensorFlow發布了一個新的優化工具包,引入post-training模型量化技術,將模型大小縮小了4倍,執行速度提升了3倍!

今天,TensorFlow發布了一個新的優化工具包:一套可以讓開發者,無論是新手還是高級開發人員,都可以使用來優化機器學習模型以進行部署和執行的技術。

這些技術對于優化任何用于部署的TensorFlow模型都非常有用。特別是對于在內存緊張、功耗限制和存儲有限的設備上提供模型的TensorFlow Lite開發人員來說,這些技術尤其重要。

優化模型以減小尺寸,降低延遲和功耗,同時使精度損失可以忽略不計

這次添加支持的第一個技術是向TensorFlow Lite轉換工具添加post-training模型量化(post-training quantization)。對于相關的機器學習模型,這可以實現最多4倍的壓縮和3倍的執行速度提升。

通過量化模型,開發人員還將獲得降低功耗的額外好處。這對于將模型部署到手機之外的終端設備是非常有用的。

啟用 post-training quantization

post-training quantization技術已集成到TensorFlow Lite轉換工具中。入門很簡單:在構建了自己的TensorFlow模型之后,開發人員可以簡單地在TensorFlow Lite轉換工具中啟用“post_training_quantize”標記。假設保存的模型存儲在saved_model_dir中,可以生成量化的tflite flatbuffer:

1converter=tf.contrib.lite.TocoConverter.from_saved_model(saved_model_dir)2converter.post_training_quantize=True3tflite_quantized_model=converter.convert()4open(“quantized_model.tflite”,“wb”).write(tflite_quantized_model)

我們提供了教程詳細介紹如何執行此操作。將來,我們的目標是將這項技術整合到通用的TensorFlow工具中,以便可以在TensorFlow Lite當前不支持的平臺上進行部署。

教程:

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/lite/tutorials/post_training_quant.ipynb

post-training 量化的好處

模型大小縮小4倍

模型主要由卷積層組成,執行速度提高10-50%

基于RNN的模型可以提高3倍的速度

由于減少了內存和計算需求,預計大多數模型的功耗也會降低

有關模型尺寸縮小和執行時間加速,請參見下圖(使用單核心在Android Pixel 2手機上進行測量)。

圖1:模型大小比較:優化的模型比原來縮小了4倍

圖2:延遲比較:優化后的模型速度提高了1.2到1.4倍

這些加速和模型尺寸的減小對精度影響很小。一般來說,對于手頭的任務來說已經很小的模型(例如,用于圖像分類的mobilenet v1)可能會發生更多的精度損失。對于這些模型,我們提供預訓練的完全量化模型(fully-quantized models)。

圖3:精度比較:除 mobilenets外,優化后的模型的精度下降幾乎可以忽略不計

我們希望在未來繼續改進我們的結果,請參閱模型優化指南以獲得最新的測量結果。

模型優化指南:

https://www.tensorflow.org/performance/model_optimization

post-training quantization的工作原理

在底層,我們通過將參數(即神經網絡權重)的精度從訓練時的32位浮點表示降低到更小、更高效的8位整數表示來運行優化(也稱為量化)。 有關詳細信息,請參閱post-training量化指南。

post-training量化指南:

https://www.tensorflow.org/performance/post_training_quantization

這些優化將確保將最終模型中精度降低的操作定義與使用fixed-point和floating-point數學混合的內核實現配對。這將以較低的精度快速執行最繁重的計算,但是以較高的精度執行最敏感的計算,因此通常會導致任務的最終精度損失很小,甚至沒有損失,但相比純浮點執行而言速度明顯提高。

對于沒有匹配的“混合”內核的操作,或者工具包認為必要的操作,它會將參數重新轉換為更高的浮點精度以便執行。有關支持的混合操作的列表,請參閱post-training quantizaton頁面。

未來的工作

我們將繼續改進post-training量化技術以及其他技術,以便更容易地優化模型。這些將集成到相關的TensorFlow工作流中,使它們易于使用。

post-training量化技術是我們正在開發的優化工具包的第一個產品。我們期待得到開發者的反饋。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133086
  • tensorflow
    +關注

    關注

    13

    文章

    329

    瀏覽量

    60631

原文標題:TensorFlow 首個優化工具來了:模型壓縮4倍,速度提升3倍!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NI LabVIEW 模型接口工具包

    哪位大神有有 LabVIEW 模型接口工具包 ?跪求!
    發表于 02-15 00:44

    如何將Lora開發工具包LoRa(R)技術評估工具包用于商業目的

    嗨,幾次之前我帶來了Lora開發工具包LoRa(R)技術評估工具包- 800。(我想在這里發布網址,但似乎不可能)。我想把這個工具包用于商業
    發表于 07-29 07:51

    STM32Cube.AI工具包使用初探

    STM32近日推出了Cube.AI人工智能神經網絡開發工具包,目標是將AI引入微控制器供電的智能設備,位于節點邊緣,以及物聯網,智能建筑,工業和醫療應用中的深度嵌入式設備。 簡而言之,以后就可以在
    發表于 02-22 06:50

    TensorFlow將神經網絡量化為8位

    使用CoreML量化工具優化模型以進行部署。查看34T蘋果開發者34Twebsite了解更多更新。 請注意,目前無法在iOS上通過CoreML部署8位量化
    發表于 08-10 06:01

    固件工具包

    固件工具包 修改工具包 高興向大家公布這個信息! 首先介紹下這個工具地用途: 1、修改固件 - 通過此工具能夠修改固件中絕大多數地信息及
    發表于 03-16 14:49 ?71次下載

    TensorFlow官方發布消息稱將引入新的優化工具包

    內存、算力、功耗,這是模型量化的主要優化對象,而在實踐中,最能從中收益的自然是在各種移動端設備上使用機器學習模型的開發人員,尤其是TensorFlo
    的頭像 發表于 09-21 08:53 ?2607次閱讀

    北大開源中文分詞工具包,名為——PKUSeg

    多領域分詞:不同于以往的通用中文分詞工具,此工具包同時致力于為不同領域的數據提供個性化的預訓練模型。根據待分詞文本的領域特點,用戶可以自由地選擇不同的模型。 我們目前支持
    的頭像 發表于 01-16 10:29 ?6807次閱讀
    北大開源<b class='flag-5'>了</b><b class='flag-5'>一</b><b class='flag-5'>個</b>中文分詞<b class='flag-5'>工具包</b>,名為——PKUSeg

    關于8流行的Python可視化工具包

    喜歡用 Python 做項目的小伙伴不免會遇到這種情況:做圖表時,用哪種好看又實用的可視化工具包呢?之前文章里出現過漂亮的圖表時,也總有讀者在后臺留言問該圖表時用什么工具做的。
    的頭像 發表于 05-05 09:02 ?3413次閱讀
    關于8<b class='flag-5'>個</b>流行的Python可視<b class='flag-5'>化工具包</b>

    firefly NCC S1--MDK - SSD模型工具包介紹

    此快速入門指南適用于GTI提供的SSD模型工具包(MDK)。工具包包含兩套工具一個模型開發
    的頭像 發表于 11-18 14:10 ?2242次閱讀

    Microchip推出軟件開發工具包和神經網絡IP

    高度靈活的工具包能夠以TensorFlow和開放神經網絡交換(ONNX)的格式執行模型,最大程度地提升框架的互操作性。ONNX支持Caffe2、MXNet、PyTorch和MATL
    的頭像 發表于 06-03 09:30 ?2805次閱讀

    谷歌發布TensorFlow用于人工智能模型的隱私保護

    近日,谷歌發布隱私保護TensorFlow工具包,可以評估各種機器學習分類器的隱私屬性。谷歌表示,它旨在成為
    發表于 07-20 11:06 ?865次閱讀

    通過 TensorFlow模型優化工具包TF MOT剪枝API

    發布人:Yunlu Li 和 Artsiom Ablavatski 簡介 剪枝是 TensorFlow 模型優化工具包 (TF MOT) 中提供的核心
    的頭像 發表于 08-16 17:26 ?4976次閱讀

    使用最新的TAO工具包簡化AI模型開發

      NVIDIA AI 企業 提供對 TAO 工具包的企業支持,這是用于 AI 開發和部署的端到端軟件套件。 TAO 工具包的新版本將
    的頭像 發表于 06-21 15:43 ?1488次閱讀

    使用NVIDIA QAT工具包實現TensorRT量化網絡的設計

      目前, TensorFlow 在其開源軟件 模型優化工具包 中提供非對稱量化。他們的量化方法包括在所需層的輸出和權重(如果適用)處插入
    的頭像 發表于 06-21 16:54 ?4324次閱讀
    使用NVIDIA QAT<b class='flag-5'>工具包</b>實現TensorRT<b class='flag-5'>量化</b>網絡的設計

    LLaMa量化部署

    使用 GPTQ 量化模型具有很大的速度優勢,與 LLM.int8() 不同,GPTQ 要求對模型進行 post-training quantization,來得到
    的頭像 發表于 08-28 16:44 ?1537次閱讀
    LLaMa<b class='flag-5'>量化</b>部署
    今天六合彩开什么| 网上百家乐官网有哪些玩法| bet365 备用网址| 水果机定位器| 永利百家乐娱乐平台| 奉新县| 九州娱乐场| 大发888 客服| 百家乐的玩法技巧和规则 | K7百家乐的玩法技巧和规则| 邯郸百家乐园怎么样| 哪个百家乐投注比较好| 星河百家乐现金网| 百家乐代理新闻| 杨筠松古法风水24| 百家乐官网桌子租| 做生意风水摆件| 百家乐游戏必赢法| 永利高百家乐怎样开户| 百家乐怎么刷反水| 真人百家乐分析软件是骗局| 最好的百家乐博彩公司| 在线百家乐官网电脑| 七胜百家乐官网赌场娱乐网规则| 百利宫百家乐官网的玩法技巧和规则 | 澳门百家乐官网然后赢| 南京百家乐官网的玩法技巧和规则 | 威尼斯人娱乐城| 宝丰县| 百家乐官网免费破解外挂| 百家乐官网路单网下载| 百家乐官网电子路单破解| 百家乐官网节目视频| 百家乐官网和抽水官网| 澳门百家乐官网游戏说明| 找查百家乐官网玩法技巧| 太阳百家乐官网游戏| 12倍百家乐秘籍| 榆次百家乐的玩法技巧和规则 | 百家乐赌博筹| 皇冠开户网|