吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

超參數優化方法PBT的原理和功效解讀

zhKF_jqr_AI ? 2017-11-29 08:59 ? 次閱讀

近日,DeepMind在論文Population Based Training of Neural Networks中提出了一種超參數優化方法,在沿用傳統隨機搜索的并行訓練的同時,從GA算法中獲得靈感引入了從其他個體復制參數更新迭代的做法,效果顯著。據官方稱,使用這種名為PBT的方法可大幅提高計算機資源利用效率,訓練更穩定,模型性能也更好。

從圍棋到雅達利游戲到圖像識別和語言翻譯,神經網絡在各領域都取得了極大的成功。但經常被忽視的一點是,神經網絡在特定應用中的成功往往取決于研究開始時做出的一系列選擇,包括使用何種類型的網絡、訓練數據和訓練方法。目前,這些選擇(超參數)的選取主要基于經驗、隨機搜索和計算機密集搜索。

在DeepMind新近發表的一篇論文中,團隊提出了一種訓練神經網絡的新方法——Population Based Training (PBT,暫譯為基于群體的訓練),通過同時訓練和優化一系列網絡,它能幫開發者迅速選擇最佳超參數和模型。

該方法其實是兩種最常用的超參數優化方法的整合:隨機搜索(random search)和手動調試(hand-tuning)。如果單純使用隨機搜索,神經網絡群體并行訓練,并在訓練結束時選擇性能最好的模型。一般來說,這意味著只有一小部分群體能接受良好的超參數訓練,而剩下的大部分訓練質量不佳,基本上只是在浪費計算機資源。

隨機搜索選取超參數,超參數并行訓練而又各自獨立。一些超參數可能有助于建立更好的模型,但其他的不會

而如果使用的是手動調試,研究人員必須首先推測哪種超參數最合適,然后把它應用到模型中,再評估性能,如此循環往復,直到他對模型的性能感到滿意為止。雖然這樣做可以實現更好的模型性能,但缺點同樣很突出,就是耗時太久,有時需要數周甚至數月才能完成優化。

如果使用手動調試或貝葉斯優化等方法通過依次觀察訓練效果選取超參數,整體進度會異常緩慢

PBT結合兩種方法的優勢。和隨機搜索一樣,它首先會訓練大量神經網絡供隨機超參數實驗,但不同的是,這些網絡不是獨立訓練的,它們會不斷整合其他超參數群體的信息來進行自我完善,同時將計算資源集中給最有潛力的模型。這個靈感來自遺傳算法(GA),在GA中,每個個體(候選解)能通過利用其他個體的參數信息進行迭代,如,一個個體能從另一個性能較優的個體中復制參數模型。同理,PBT鼓勵每個超參數通過隨機更改當前值來探索形成新的超參數。

隨著對神經網絡訓練的不斷深入,這個開發和探索的過程是定期進行的,以確保所有超參數都有一個良好的基礎性能,同時,新超參數也在不斷形成。這意味著PBT可以迅速選取優質超參數,并把更多的訓練時間投入到最有潛力的模型中,最關鍵的是,它還允許在訓練過程中調整超參數值,從而自動學習最佳配置。

PBT的神經網絡訓練從隨機搜索開始,但允許個體利用其他個體的部分結果,并隨著訓練的進行探索形成新超參數

為了測試PBT的效果,DeepMind做了一些實驗。如研究人員在DeepMind Lab、雅達利和星際2三個游戲平臺上用最先進的方法測試了一套具有相當挑戰性的強化學習問題。實驗證明,在所有情況下,PBT都訓練穩定,并且迅速找到了最佳超參數,提供了超出最新基線的結果。

他們還發現PBT同樣適用于生成對抗網絡(GAN)。一般來說,GAN的超參數很難調試,但在一次實驗中,DeepMind的PBT框架使模型的Inception Score(圖像保真度分數)達到了新高,從6.45躍升至6.89(如上圖最后一幅圖所示)。

PBT也在Google的機器翻譯神經網絡上進行了實驗。作為谷歌最先進的機翻工具,這些神經網絡使用的超參數優化方法是手動調試,這意味著在投入使用前,它們需要按照研究人員精心設計的超參數時間表進行長達數月的訓練。使用PBT,計算機自動建立了時間表,該訓練計劃所獲得的模型性能和現用方法差不多,甚至更好,而且只需進行一次訓練就可以獲得滿意的模型。

PBT在GAN和雅達利游戲“吃豆子女士”上的表現:粉色點為初代,藍色點為末代,分支代表操作已執行(參數已復制),路徑表示步驟的連續更新

DeepMind相信,這只是超參數優化方法創新的一個開始。綜合論文可知,PBT對于訓練引入新超參數的算法和神經網絡結果特別有用,它為尋找和開發更復雜、更強大的神經網絡模型提供了可能性。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101169

原文標題:DeepMind最新研究:基于群體的神經網絡訓練

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2006 年微控制器五大趨勢-外圍篇(微控制器基本功效解讀)

    2006 年微控制器五大趨勢-外圍篇(微控制器基本功效解讀)雖然在許多層面上MCU 與MPU 難有明確分際,但若反過來問:MCU 與MPU 的明顯分際為何?對此這樣的問題,答案可能會在整合
    發表于 09-24 09:36

    【免費直播】李增和大家一起學習S參數的相關知識及提取解讀分析優化S參數方法

    的直播內容以S參數的相關知識點為切入口,詳細講解S參數含義和S參數關鍵指標,以及提取S參數提取優化的相關
    發表于 11-28 16:33

    【免費直播】李增和大家一起學習S參數的相關知識及提取解讀分析優化S參數方法

    的直播內容以S參數的相關知識點為切入口,詳細講解S參數含義和S參數關鍵指標,以及提取S參數提取優化的相關
    發表于 11-28 16:37

    【免費直播】李增和大家一起學習S參數的相關知識及提取解讀分析優化S參數方法

    的直播內容以S參數的相關知識點為切入口,詳細講解S參數含義和S參數關鍵指標,以及提取S參數提取優化的相關
    發表于 11-29 11:31

    改善深層神經網絡--參數優化、batch正則化和程序框架 學習總結

    《深度學習工程師-吳恩達》02改善深層神經網絡--參數優化、batch正則化和程序框架 學習總結
    發表于 06-16 14:52

    優化面向超低功耗設計的微控制器功效

    優化面向超低功耗設計的微控制器功效 不論是消費、工業還是醫療應用,功耗優化一般都是通過縮短有效處理時間以及延長處理器睡眠模式時間來實現的。不過,隨著
    發表于 01-06 11:40 ?997次閱讀

    PID調節器參數優化設計的改進方法

    本文較詳細地介紹了 PID調節器 參數優化設計原理,提出了一種簡便實用的PID調節器優化參數初始值選擇方法
    發表于 07-18 16:52 ?134次下載
    PID調節器<b class='flag-5'>參數</b><b class='flag-5'>優化</b>設計的改進<b class='flag-5'>方法</b>

    調參心得:如何優化參數的,如何證實方法是有效的

    自動化參數優化及其工具最主要的問題之一,是你常常偏離原本的工作方式。預測任務無關的參數優化
    的頭像 發表于 08-31 09:53 ?2w次閱讀

    PerferredNetworks發布了其參數優化框架的beta版本

    Optuna作為參數優化框架可以和PFN自己的深度學習框架Chainer充分結合使用。只需要在Chainer中寫接受來自Optuna的參數
    的頭像 發表于 12-14 09:47 ?3145次閱讀

    機器學習的參數調優方法

    對于很多算法工程師來說,參數調優是件非常頭疼的事,這項工作比較玄學。除了根據經驗設定所謂的“合理值”之外,一般很難找到合理的方法去尋找參數
    的頭像 發表于 05-03 12:24 ?2753次閱讀

    機器學習的幾個參數調試方法

    作者:Sivasai,來源:AI公園導讀 ML工作流中最困難的部分之一是為模型找到最好的參數。ML模型的性能與參數直接相關。 介紹 維基百科上說,Hyperparameter
    的頭像 發表于 10-09 14:17 ?2989次閱讀

    基于樹狀結構Parzen估計方法參數優化方法

    億測序片段聚類提供了一種可擴展的解決方案。但是, Sparc算法參數的設置是一項非常具有挑戰性的工作。 Sparc算法擁有許多對算法性能有著很大影響的參數,選擇合適的
    發表于 04-13 14:42 ?23次下載
    基于樹狀結構Parzen估計<b class='flag-5'>方法</b>的<b class='flag-5'>超</b><b class='flag-5'>參數</b><b class='flag-5'>優化</b><b class='flag-5'>方法</b>

    PyTorch教程19.1之什么是參數優化

    電子發燒友網站提供《PyTorch教程19.1之什么是參數優化.pdf》資料免費下載
    發表于 06-05 10:25 ?0次下載
    PyTorch教程19.1之什么是<b class='flag-5'>超</b><b class='flag-5'>參數</b><b class='flag-5'>優化</b>

    PyTorch教程19.2之參數優化API

    電子發燒友網站提供《PyTorch教程19.2之參數優化API.pdf》資料免費下載
    發表于 06-05 10:27 ?0次下載
    PyTorch教程19.2之<b class='flag-5'>超</b><b class='flag-5'>參數</b><b class='flag-5'>優化</b>API

    MOSFET參數解讀

    SGT-MOSFET各項參數解讀
    發表于 12-30 14:15 ?1次下載
    赌场百家乐官网攻略| 赌百家乐2号破解| 在线百家乐官网博彩| 516棋牌游戏中心 官方版| 百家乐官网赌机厂家| 大发888婚庆车队| 澳门百家乐职业赌客| 百家乐官网乐翻天| 最好的网上真人赌博| 永利高平台网址| 百家乐三珠连跳打法| 百家乐官网最新缆| 百家乐官网手机软件| 大发888娱乐城888bg| 百家乐的看路技巧| 百家乐是赌博吗| 百家乐官网桌手机套| 利博国际网址| 大发888娱乐场解码器| 怎样玩百家乐才能| 百家乐足球投注网哪个平台网址测速最好| 百家乐官网大路小路三珠路| 百家乐官网里面的奥妙| 六合彩网址大全| 大发888在线娱乐城代理| 香港百家乐马书| 百家乐真人游戏网上投注| 扑克百家乐官网麻将筹码防伪| 温州市百家乐官网鞋业| 百家乐官网视频游戏网站| 彩票| 宝马会在线娱乐城| 皇冠网都市小说| 澳门赌场有老千| 网页百家乐官网游戏下载| 试玩百家乐官网游戏机| 百家乐官网太阳城菲律宾| 美国百家乐官网怎么玩| 塔城市| 乐宝百家乐官网娱乐城| 百家乐官网是哪个国家|