吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI的研究人員開發(fā)了一套基于能量的神經(jīng)網(wǎng)絡(luò)模型

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-10 10:34 ? 次閱讀

OpenAI的研究人員開發(fā)了一套基于能量的神經(jīng)網(wǎng)絡(luò)模型,可以快速學(xué)會(huì)識(shí)別并生成關(guān)于概念的實(shí)例,比如附近、上方、之間、最近、最遠(yuǎn)等,并將這些概念用2D點(diǎn)集來表示。模型可以僅在5次演示之后就學(xué)會(huì)這類概念,并實(shí)現(xiàn)了跨領(lǐng)域的概念遷移。

衡量是否達(dá)到人類智能,涉及由有限的經(jīng)驗(yàn),通過抽象推理和規(guī)劃、類比推理、創(chuàng)造性問題解決和語(yǔ)言能力的概括,從而將經(jīng)驗(yàn)整合到概念中,將概念作為理解和推理的基本架構(gòu)。

這款基于能量的新模型,讓智能體能夠從任務(wù)中學(xué)習(xí)和提取概念,并使用這些概念來解決多個(gè)領(lǐng)域中的其他任務(wù)。比如可以在2D粒子環(huán)境中應(yīng)用的學(xué)習(xí)概念,然后在基于3D的機(jī)器人環(huán)境中執(zhí)行相同的任務(wù),無需在新環(huán)境中重新訓(xùn)練。

通過基于能量的模型訓(xùn)練的模擬機(jī)器人,利用不同2D域中學(xué)習(xí)到的概念,將手臂導(dǎo)航至兩點(diǎn)之間

本研究利用能量函數(shù),讓智能體學(xué)習(xí)分類和生成簡(jiǎn)單的概念,來解決在不同環(huán)境中的兩點(diǎn)之間導(dǎo)航等任務(wù)。這些概念包括視覺概念(“紅色”、“正方形”)、空間概念(“內(nèi)部”、“在...之上”)、時(shí)間概念(“慢”、“之后”),社會(huì)概念(“積極”、“有用”)等等。

一旦智能體學(xué)會(huì)了這些概念,就會(huì)成為其理解和推理的基本模塊,最近DeepMind和 Vicarious的一些其他研究也表明了這一點(diǎn)。

能量函數(shù)讓系統(tǒng)可以生成(左)并識(shí)別(右)基本概念,比如“正方形”的概念。

構(gòu)建能量函數(shù):基于關(guān)系網(wǎng)絡(luò)體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)

為了創(chuàng)建能量函數(shù),需要在數(shù)學(xué)上將概念表示為能量模型。

我們根據(jù)以下要素來定義每個(gè)概念的能量函數(shù) E(x,a,w):

模型觀察到的世界狀態(tài)(x)

該狀態(tài)下該實(shí)體的注意力掩膜(a)。

作為條件的連續(xù)值向量(w),用于指定計(jì)算能量的概念

世界上的眾多狀態(tài)由多組實(shí)體及其屬性和位置組成(比如下面的點(diǎn),就具有位置和顏色屬性)。用于“識(shí)別”的注意力掩膜表示模型對(duì)某些實(shí)體集的關(guān)注。

能量模型輸出單個(gè)正數(shù),表示滿足相應(yīng)概念(零能量)或不滿足概念(高能量)。當(dāng)注意力掩模集中在表示概念的一組實(shí)體上時(shí),該概念即被滿足,這需要實(shí)體處于正確的位置(修改x、生成概念),而且注意力掩膜關(guān)注的是正確的實(shí)體(修改a、識(shí)別概念)。

我們將能量函數(shù)構(gòu)建為基于關(guān)系網(wǎng)絡(luò)體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),允許其將任意數(shù)量的實(shí)體作為輸入。這個(gè)能量函數(shù)的參數(shù)是由我們的訓(xùn)練程序進(jìn)行優(yōu)化的,其他函數(shù)是從能量函數(shù)中隱式導(dǎo)出的。

這樣,我們能夠使用能量函數(shù)來學(xué)習(xí)可以執(zhí)行生成和識(shí)別的單個(gè)網(wǎng)絡(luò),并可以交叉使用從生成到識(shí)別的學(xué)習(xí)概念,反之亦然。(目前已經(jīng)通過鏡像神經(jīng)元在動(dòng)物身上觀察到了這種效應(yīng)。)

單一網(wǎng)絡(luò)的訓(xùn)練

訓(xùn)練數(shù)據(jù)由(注意掩膜、狀態(tài))的軌跡組成,提前生成的軌跡用于確認(rèn)我們希望模型學(xué)習(xí)的特定概念。我們?yōu)榻o定概念集提供一組演示(通常為5次)來訓(xùn)練模型,然后將模型置于一個(gè)新的環(huán)境(X0),并要求其預(yù)測(cè)下一個(gè)狀態(tài)(X1)和下一個(gè)注意力掩膜(a)。

優(yōu)化能量函數(shù),向訓(xùn)練數(shù)據(jù)中找到的下一個(gè)狀態(tài)和下一個(gè)注意力掩模分配低能量值。與變分自動(dòng)編碼器等生成模型類似,激勵(lì)模型去學(xué)習(xí)那些對(duì)于壓縮任務(wù)方面的有用值。我們使用各種概念來訓(xùn)練模型,包括視覺,空間,遠(yuǎn)近和時(shí)間關(guān)系,以及二維粒子環(huán)境中的量化。

空間區(qū)域概念:給出2D示例點(diǎn)(左),推斷該點(diǎn)上的能量函數(shù)(中間),然后使用能量上的隨機(jī)梯度下降來生成新的點(diǎn)(右)

模型在概念生成和識(shí)別訓(xùn)練中分享經(jīng)驗(yàn),實(shí)現(xiàn)遷移學(xué)習(xí)

我們?cè)谝幌盗腥蝿?wù)中對(duì)模型進(jìn)行了評(píng)估,旨在測(cè)試單一系統(tǒng)識(shí)別和生成相同概念下的目標(biāo)的能力,我們的系統(tǒng)可以學(xué)習(xí)分類,可以生成特定的空間關(guān)系集,還可以以特定方式通過場(chǎng)景對(duì)實(shí)體進(jìn)行導(dǎo)航,或者可以對(duì)數(shù)量(比如一個(gè)、兩個(gè)、三個(gè)或三個(gè)以上)或接近度等概念進(jìn)行比較準(zhǔn)確的判斷。

數(shù)量概念:示例注意力掩膜在一個(gè)、兩個(gè)、三個(gè)或三個(gè)以上的目標(biāo)上的表現(xiàn),可推斷用于生成類似數(shù)量概念的注意力掩模

模型在學(xué)習(xí)概念的生成(通過在狀態(tài)向量x中移動(dòng)目標(biāo)實(shí)現(xiàn))和識(shí)別(通過在固定狀態(tài)向量上更改注意力掩膜實(shí)現(xiàn))之間分享經(jīng)驗(yàn)時(shí)的表現(xiàn)更好:在我們對(duì)共同執(zhí)行這兩類任務(wù)的模型進(jìn)行評(píng)估時(shí)發(fā)現(xiàn),它們的表現(xiàn)都比僅在各自執(zhí)行單一任務(wù)訓(xùn)練的模型更好。

此外,我們還發(fā)現(xiàn)了遷移學(xué)習(xí)的跡象。只在概念識(shí)別環(huán)境中訓(xùn)練過的能量函數(shù),也能很好地執(zhí)行概念生成任務(wù),即使其沒有經(jīng)過明確的訓(xùn)練。

未來方向:進(jìn)一步探索概念和語(yǔ)言理解的關(guān)系

我們很高興能夠在更豐富的三維環(huán)境中學(xué)到的更廣泛的概念,將概念與智能體決策策略相結(jié)合(因?yàn)榈侥壳盀橹梗覀冎皇菍⒏拍钜暈閺谋粍?dòng)體驗(yàn)中學(xué)到的東西),并探索概念和語(yǔ)言理解之間的聯(lián)系。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28641

    瀏覽量

    208405
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4779

    瀏覽量

    101168
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    166

    瀏覽量

    10613

原文標(biāo)題:OpenAI概念學(xué)習(xí)新模型:學(xué)會(huì)概念僅需5次示范,實(shí)現(xiàn)跨領(lǐng)域概念遷移

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成  第2章人工神經(jīng)網(wǎng)絡(luò)基本
    發(fā)表于 03-20 11:32

    如何構(gòu)建神經(jīng)網(wǎng)絡(luò)

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反
    發(fā)表于 07-12 08:02

    隱藏技術(shù): 種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器

    隱藏技術(shù): 種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器 Copy東京理工大學(xué)的研究人員開發(fā)了種名為“ Hiddenite”的新型加速器芯
    發(fā)表于 03-17 19:15

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    network,DBN)[24], 從此拉開了深度學(xué)習(xí)大幕。隨著深度學(xué)習(xí)理論的研究和發(fā)展,研究人員提 出了系列卷積神經(jīng)網(wǎng)絡(luò)模型。為了比較
    發(fā)表于 08-02 10:39

    OpenAI發(fā)布工具庫(kù) 可在GPU上建立更快、更高效、占內(nèi)存更少的神經(jīng)網(wǎng)絡(luò)

    OpenAI研究人員日前發(fā)布了個(gè)工具庫(kù),該工具庫(kù)可以幫助研究人員在圖形處理器(graphics-processor-unit,GPU)上建立更快、更高效、占內(nèi)存更少的
    的頭像 發(fā)表于 01-27 00:34 ?4062次閱讀
    <b class='flag-5'>OpenAI</b>發(fā)布工具庫(kù) 可在GPU上建立更快、更高效、占內(nèi)存更少的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    深度神經(jīng)決策樹:深度神經(jīng)網(wǎng)絡(luò)和樹模型結(jié)合的新模型

    近日,來自愛丁堡大學(xué)的研究人員提出了種結(jié)合深度神經(jīng)網(wǎng)絡(luò)和樹模型的新型模型——深度神經(jīng)決策樹(D
    的頭像 發(fā)表于 08-19 09:14 ?1.3w次閱讀

    研究人員開發(fā)解釋多義詞的神經(jīng)網(wǎng)絡(luò)

    艾倫人工智能研究所和華盛頓大學(xué)的研究人員正在使用可以根據(jù)上下文來確定英文單詞含義的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 09-12 15:52 ?2243次閱讀

    研究人員開發(fā)了種新穎的機(jī)器學(xué)習(xí)管道

    研究人員通過種特殊的神經(jīng)網(wǎng)絡(luò)模型,它以“基本塊”(計(jì)算指令的基本摘要)形式訓(xùn)練標(biāo)記的數(shù)據(jù),以自動(dòng)預(yù)測(cè)其持續(xù)時(shí)間使用給定的芯片執(zhí)行以前看不見的基本塊。結(jié)果表明,這種
    的頭像 發(fā)表于 04-15 16:42 ?1875次閱讀

    基于內(nèi)存的人工智能神經(jīng)網(wǎng)絡(luò)架構(gòu)

    在過去十年左右的時(shí)間里,研究人員已經(jīng)開發(fā)了多種基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的計(jì)算模型。盡管已發(fā)現(xiàn)許多這些模型在特定任務(wù)上表現(xiàn)良好,但它們并不總
    的頭像 發(fā)表于 12-18 13:40 ?1651次閱讀

    研究人員開發(fā)“液態(tài)”神經(jīng)網(wǎng)絡(luò) 可適應(yīng)快速變化的訓(xùn)練環(huán)境

    設(shè)計(jì)出了種具有重大改進(jìn)的“液態(tài)”神經(jīng)網(wǎng)絡(luò)。其特點(diǎn)是能夠在投入訓(xùn)練階段之后,極大地?cái)U(kuò)展 AI 技術(shù)的靈活性。 通常情況下,研究人員會(huì)在訓(xùn)練階段向神經(jīng)網(wǎng)絡(luò)算法提供大量相關(guān)的目標(biāo)數(shù)據(jù),來磨
    的頭像 發(fā)表于 01-29 10:46 ?1598次閱讀

    OpenAI研究人員開發(fā)出新的機(jī)械臂

    近日,兩個(gè)由 OpenAI研究人員開發(fā)一模一樣的機(jī)械臂愛麗絲和鮑勃,可以在模擬情景中通過對(duì)弈互相學(xué)習(xí),而不需要人為輸入文本。
    的頭像 發(fā)表于 02-23 10:40 ?1940次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型? 卷積
    的頭像 發(fā)表于 08-21 17:11 ?1306次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建 卷積神經(jīng)網(wǎng)絡(luò)模型種深度學(xué)習(xí)算法。它已經(jīng)成為了計(jì)算機(jī)視覺和自然語(yǔ)言處理等各種領(lǐng)域的主流算法,具有很大的應(yīng)用前景。本篇
    的頭像 發(fā)表于 08-21 17:11 ?1013次閱讀

    PyTorch神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過程

    PyTorch,作為個(gè)廣泛使用的開源深度學(xué)習(xí)庫(kù),提供了豐富的工具和模塊,幫助開發(fā)者構(gòu)建、訓(xùn)練和部署神經(jīng)網(wǎng)絡(luò)模型。在神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-10 14:57 ?563次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型

    處理、語(yǔ)音識(shí)別等領(lǐng)域取得了顯著的成果。PyTorch是個(gè)開源的深度學(xué)習(xí)框架,由Facebook的AI研究團(tuán)隊(duì)開發(fā)。它以其易用性、靈活性和高效性而受到廣泛歡迎。在PyTorch中,有許多預(yù)訓(xùn)練的
    的頭像 發(fā)表于 07-11 09:59 ?813次閱讀
    太阳城百家乐官网注册平台 | 百家乐游戏机破解方法| 百家乐官网视频打麻将| 百家乐规律打| 云鼎百家乐官网代理| 澳门百家乐玩| 百家乐2号技术| 大发8888娱乐场| 南漳县| 在线玩百家乐官网的玩法技巧和规则 | 免费百家乐官网过滤| 淅川县| 大发888战神娱乐| 百家乐打立了| 百家乐官网稳赢秘诀教学| 那曲县| 大发888游戏交易平台| 名仕百家乐官网的玩法技巧和规则 | 淘金盈国际线上娱乐| 澳门百家乐官网必赢技巧| 百家乐专业赌博| 大发888在线下载| 玩百家乐官网去哪个平台好| 百家乐分析仪博彩正网| 单机棋牌游戏下载| 迪威百家乐官网娱乐网| 泰山百家乐的玩法技巧和规则| 百家乐官网U盘下载| 巴特百家乐官网的玩法技巧和规则 | 香港百家乐官网的玩法技巧和规则 | 电脑百家乐官网玩| 中国百家乐澳门真人娱乐平台网址| 迷你百家乐的玩法技巧和规则| 普陀区| 百家乐视频游戏大厅| 最好的网上真人赌博| 属狗人做生意店铺朝向| 名仕棋牌官网| 马尼拉百家乐官网的玩法技巧和规则| 大发888易付168 充值| 菲律宾百家乐官网开户|