97msc,今日体育赛事视频直播,百家乐官网的规则玩法(中国)·官方网站

在認(rèn)知心理學(xué)和神經(jīng)科學(xué)中豐富的視覺推理和記憶傳統(tǒng)的啟發(fā)下，我們開發(fā)了一個人工的、可配置的視覺問題和答案數(shù)據(jù)集（COG），用于在人類和動物中進(jìn)行平行實驗。COG比視頻分析的一般問題要簡單得多，但它解決了許多與視覺、邏輯推理和記憶有關(guān)的問題——這些問題對現(xiàn)代的深度學(xué)習(xí)架構(gòu)來說仍然具有挑戰(zhàn)性。

可以這樣說，人工智能中一個令人煩惱的問題是對發(fā)生在復(fù)雜的、不斷變化的視覺刺激中的事件進(jìn)行推理，比如視頻分析或游戲。在認(rèn)知心理學(xué)和神經(jīng)科學(xué)中豐富的視覺推理和記憶傳統(tǒng)的啟發(fā)下，我們開發(fā)了一個人工的、可配置的視覺問題和答案數(shù)據(jù)集（COG），用于在人類和動物中進(jìn)行平行實驗。COG比視頻分析的一般問題要簡單得多，但它解決了許多與視覺、邏輯推理和記憶有關(guān)的問題——這些問題對現(xiàn)代的深度學(xué)習(xí)架構(gòu)來說仍然具有挑戰(zhàn)性。此外，我們還提出了一個深度學(xué)習(xí)架構(gòu)，它在其他診斷VQA數(shù)據(jù)集（例如CLEVR）和COG數(shù)據(jù)集的簡單設(shè)置上表現(xiàn)得非常出色。然而，一些COG的設(shè)置會導(dǎo)致數(shù)據(jù)集變得越來越難以進(jìn)行學(xué)習(xí)。訓(xùn)練結(jié)束后，該網(wǎng)絡(luò)可以零次泛化到許多新任務(wù)中。對在COG上訓(xùn)練的網(wǎng)絡(luò)架構(gòu)的初步分析表明，該網(wǎng)絡(luò)以一種人類可解釋的方式完成了任務(wù)。

圖1：來自COG數(shù)據(jù)集的圖像和指令樣本序列。COG數(shù)據(jù)集中的任務(wù)對目標(biāo)識別、關(guān)系理解以及記憶的操作和調(diào)整以解決問題。每個任務(wù)都可以涉及當(dāng)前圖像和之前圖像中所顯示的目標(biāo)。需要注意的是，在最后一個樣本中，指令涉及的是“l(fā)ast”，而不是“l(fā)ast b”。前者排除圖像中當(dāng)前的“b”。（白色箭頭）顯示了每個圖像的目標(biāo)指示響應(yīng)。為了清晰起見，使用高分辨率圖像和適當(dāng)?shù)挠⒄Z表示。

人工智能的一個主要目標(biāo)是建立一個能夠強大且靈活地推理出感官環(huán)境的系統(tǒng)。視覺提供了一個非常豐富和高度適用的領(lǐng)域，用以鍛煉我們建立一個能夠?qū)?fù)雜刺激物形成邏輯推理的系統(tǒng)的能力。研究視覺推理的一個途徑是視覺問題回答（VQA）數(shù)據(jù)集，其中，模型學(xué)習(xí)該如何正確回答關(guān)于靜態(tài)圖像的具有挑戰(zhàn)性的自然語言問題。雖然在這些多模態(tài)數(shù)據(jù)集的研究上取得了非常顯著的成果，但這些數(shù)據(jù)集突出顯示了當(dāng)前方法所存在的若干局限性。首先，在VQA數(shù)據(jù)集上進(jìn)行訓(xùn)練的模型的訓(xùn)練程度無法確定，僅僅是遵循圖像中固有的統(tǒng)計信息，而不是對問題的邏輯組成部分進(jìn)行推理。其次，這些數(shù)據(jù)集避免了時間和記憶的復(fù)雜性，而這兩個因素在智能體設(shè)計、視頻的分析和總結(jié)中具有至關(guān)重要的作用。

圖2：組合型COG數(shù)據(jù)集的生成。COG數(shù)據(jù)集基于一組操作符（A），它們被組合以形成各種任務(wù)圖形（B）。（C）通過指定圖形中所有運算符的屬性來對任務(wù)進(jìn)行實例化。任務(wù)實例用于生成圖像序列和語義任務(wù)指令。（D）正向執(zhí)行圖形和圖像序列以執(zhí)行常規(guī)任務(wù)。（E）生成一致的、具有最小偏差的圖像序列需要以逆向拓?fù)漤樞蚍聪蛲ㄟ^圖形，并按逆時間順序通過圖像序列。

為了解決VQA數(shù)據(jù)集中有關(guān)空間關(guān)系的邏輯推理所存在的不足，Johnson及其同事最近提出使用CLEVR直接對基本視覺推理模型進(jìn)行測試，以便與其他VQA數(shù)據(jù)集一起使用。CLEVR數(shù)據(jù)集提供了人工的、靜態(tài)的圖像以及有關(guān)這些圖像的自然語言問題，從而鍛煉模型執(zhí)行邏輯和視覺推理的能力。最近的研究結(jié)果表明，網(wǎng)絡(luò)以接近完美的精確度取得了令人印象深刻的性能表現(xiàn)成績。

在這項研究中，我們解決了視覺推理中關(guān)于時間和記憶的第二個局限性問題。推理智能體必須記住其視覺歷史的相關(guān)部分，忽略不相關(guān)的細(xì)節(jié)，根據(jù)新的信息更新和操作記憶，并在接下來的時間里利用此記憶做出決策。我們的方法是創(chuàng)建一個人工數(shù)據(jù)集，它具有時間變化數(shù)據(jù)中所存在的許多復(fù)雜性，同時也避免了在處理視頻時所遇到的許多視覺復(fù)雜性和技術(shù)難度性問題（例如，視頻解碼、跨時間平滑幀的冗余）。特別是，我們從認(rèn)知心理學(xué)（cognitive psychology）和現(xiàn)代系統(tǒng)神經(jīng)科學(xué)（modern systems neuroscience）的幾十年研究中獲得靈感，在這些領(lǐng)域中，長期以來都是將視覺推理解剖為基于空間和邏輯推理、記憶組合性和語義理解的核心組件。為了實現(xiàn)這一目標(biāo)，我們建立了一個人工數(shù)據(jù)集—COG，能夠執(zhí)行與人類認(rèn)知實驗同時進(jìn)行的視覺推理。

圖3：所提出網(wǎng)絡(luò)的架構(gòu)圖

COG數(shù)據(jù)集基于一種編程語言，該語言構(gòu)建一系列任務(wù)三元組：一個圖像序列、一個語言指令和一系列正確的答案。這些隨機生成的三元組在大量任務(wù)中進(jìn)行視覺推理，并需要文本的語義理解、序列中每個圖像的視覺感知以及工作記憶，從而確定隨時間不同變化的答案（如圖1所示）。我們對編程語言中的若干個參數(shù)進(jìn)行了強調(diào)，從而使研究人員能夠?qū)栴}難度按照從容易到具有挑戰(zhàn)性進(jìn)行設(shè)置調(diào)整。

最后，我們引入了一個多模態(tài)循環(huán)體系結(jié)構(gòu)，用于進(jìn)行記憶視覺推理。該網(wǎng)絡(luò)將語義和視覺模塊與狀態(tài)控制器相結(jié)合，對視覺注意力和記憶進(jìn)行調(diào)節(jié)，以便正確執(zhí)行視覺任務(wù)。經(jīng)過一系列的研究，我們證明這個模型在CLEVR數(shù)據(jù)集上達(dá)到了近乎最先進(jìn)的性能表現(xiàn)。此外，該網(wǎng)絡(luò)提供了一個強大的基線，可以在一系列設(shè)置中的COG數(shù)據(jù)集上實現(xiàn)良好的性能表現(xiàn)。通過消融研究和網(wǎng)絡(luò)動力學(xué)分析，我們發(fā)現(xiàn)該網(wǎng)絡(luò)采用的是人類可解釋的注意力機制來解決這些視覺推理任務(wù)的。我們希望COG數(shù)據(jù)集、相應(yīng)的體系結(jié)構(gòu)以及相關(guān)的基線能夠為隨時間變化的視覺刺激推理的研究提供有用的基準(zhǔn)。

圖4：通過單個CLEVR樣本的注意力和輸出，對提出網(wǎng)絡(luò)的思考過程進(jìn)行可視化。（A）來自CLEVR驗證集的樣本問題和圖像。（B）每個思考步驟的有效特征注意力圖。（C）相對空間注意力圖。（D）語義注意力。（E）前五名的語言輸出。紅色和藍(lán)色分別表示更強和更弱。在同時關(guān)注到“小金屬球體”的特征注意力和“紅色橡膠物體后面”的空間注意力之后，在語言輸出中反應(yīng)了有關(guān)物體的顏色（黃色）。后來在思考過程中，網(wǎng)絡(luò)關(guān)注了“大啞光球”的特征注意力，而同時語言輸出中出現(xiàn)了正確答案（yes）。

在該項研究中，我們建立了一個合成的、組合型數(shù)據(jù)集，該數(shù)據(jù)集需要一個系統(tǒng)能夠基于英語指令對圖像序列執(zhí)行各種任務(wù)。我們COG數(shù)據(jù)集中包含的任務(wù)，測試了一系列認(rèn)知推理技能，尤為重要的是，這需要對過去的目標(biāo)有顯式記憶（explicit memory）。該數(shù)據(jù)集擁有最小偏差和高度可配置性，旨在通過大量的指定性任務(wù)生成豐富的性能指標(biāo)。

我們還構(gòu)建了一個循環(huán)神行網(wǎng)絡(luò)模型，該模型利用注意力機制和門控機制，以一種自然的，且具有人性化的方式處理COG數(shù)據(jù)集。除此之外，該模型還在另一個名為CLEVR的視覺推理數(shù)據(jù)集上實現(xiàn)了近乎最先進(jìn)的性能表現(xiàn)。該模型使用循環(huán)控制器來關(guān)注圖像和指令的不同部分，并以一種迭代的方式生成語言輸出。這些迭代注意力信號為模型的逐步思考過程提供了多個窗口，并為模型該如何將復(fù)雜的指令分解為更小的計算提供了線索。最后，該網(wǎng)絡(luò)可以即刻泛化到完全未經(jīng)訓(xùn)練的任務(wù)上，從而展現(xiàn)出對新任務(wù)的零次學(xué)習(xí)（zero-shot）能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

編程語言

編程語言

+關(guān)注

關(guān)注
10

文章
1950

瀏覽量
34988
人工智能

人工智能

+關(guān)注

關(guān)注
1796

文章
47681

瀏覽量
240298
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1209

瀏覽量
24835

原文標(biāo)題：紐約大學(xué)聯(lián)合谷歌大腦提出「COG」數(shù)據(jù)集，可提高系統(tǒng)的「視覺推理」能力

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

C語言編程通集(免費版)

發(fā)表于 08-20 17:29

C語言編程技巧程序集

本帖最后由 lee_st 于 2016-11-7 09:59 編輯 C語言編程技巧程序集1

發(fā)表于 11-07 09:58

C語言編程技巧程序集

C語言編程技巧程序集:dos命令擴(kuò)充，給硬盤加鎖，外設(shè)的軟鎖和解除，DIR功能擴(kuò)充，鼠標(biāo)在程序設(shè)計中的應(yīng)用等內(nèi)容。

發(fā)表于 08-04 15:14 ?107次下載

C<b class='flag-5'>語言</b><b class='flag-5'>編程</b>技巧程序<b class='flag-5'>集</b>

C語言編程通集

電子發(fā)燒友網(wǎng)為大家提供了C語言編程通集，希望對您有所幫助，本站資源全是免費，如果您覺得本站不錯，請把電子發(fā)燒友網(wǎng)推薦給您的朋友！

發(fā)表于 11-07 17:33 ?0次下載

基于圖形化編程語言Labview的一種虛擬儀器的實現(xiàn)

基于圖形化編程語言Labview的一種虛擬儀器的實現(xiàn)。

發(fā)表于 01-20 16:26 ?19次下載

一種多數(shù)據(jù)集混合累加電路設(shè)計

一種多數(shù)據(jù)集混合累加電路設(shè)計_胡浩

發(fā)表于 01-07 20:49 ?4次下載

編程能力是一種解決問題的能力

編程能力是一種解決問題的能力。如果問題沒能被很好地解決，知道再多也沒用。編程能力是一種運用機器解決問題的能力。首先是要判斷問題在什么程度上可被機器解決，比如理論計算機科學(xué)會告訴我們什

發(fā)表于 10-12 10:52 ?0次下載

arduino用什么語言編程

Arduino使用C/C++編寫程序，雖然C++兼容C語言，但這是兩種語言，C語言是一種面向過程的編程

發(fā)表于 11-08 15:21 ?7w次閱讀

Java編程和c語言哪一種更有優(yōu)勢_C語言與JAVA的區(qū)別是什么

軟件開發(fā)編程語言多達(dá)600余種，每種都有各自的特點和應(yīng)用領(lǐng)域。目前，在國內(nèi)，最熱的幾門編程語言無外乎Java、C、C++了，Java和C同為面向?qū)ο?b class='flag-5'>

發(fā)表于 02-05 17:23 ?2.5w次閱讀

vb編程語言是做什么用的_VB編程語言有哪些

編程語言（programming language），是用來定義計算機程序的形式語言。它是一種被標(biāo)準(zhǔn)化的交流技巧，用來向計算機發(fā)出指令。一種

發(fā)表于 03-13 16:52 ?8.3w次閱讀

機器學(xué)習(xí)中最流行的10種編程語言

去學(xué)習(xí)一種新的編程語言呢？如果作為一名機器人學(xué)新人，你當(dāng)然會想學(xué)習(xí)一種確實對你的職業(yè)生涯很有用的編程

發(fā)表于 01-01 11:02 ?3983次閱讀

2021年程序員必學(xué)的五種編程語言

如果您是編程新手，不知道從哪里開始，這篇文章正好適合您?，F(xiàn)在有超過100種編程語言（Goolge說有700多種），所以有很多選擇。選擇第一種

發(fā)表于 03-01 15:52 ?8269次閱讀

Python是一種什么語言，它可以用來做些什么

智慧人生，首選Python Python是一種什么語言？ Python是一種計算機程序設(shè)計語言。你可能已經(jīng)聽說過很多種流行的編程

發(fā)表于 04-12 10:56 ?1309次閱讀

Python編程語言屬于什么語言

Python編程語言屬于高級編程語言中的一種。它是一種通用、面向?qū)ο?、解釋?/div>
發(fā)表于 11-22 14:31 ?1626次閱讀

四種編程語言之間的區(qū)別和聯(lián)系

、背景和發(fā)展 Python：Python由Guido van Rossum于上世紀(jì)90年代初開發(fā)，以其簡潔、易讀的語法和豐富的第三方庫而受到廣泛歡迎。它是一種高級編程語言，尤其擅長數(shù)據(jù)

發(fā)表于 02-05 14:16 ?1748次閱讀

吴忠躺衫网络科技有限公司

搜索歷史

COG數(shù)據(jù)集基于一種編程語言

評論

C語言編程通集(免費版)

C語言編程技巧程序集

C語言編程技巧程序集

C語言編程通集

基于圖形化編程語言Labview的一種虛擬儀器的實現(xiàn)

一種多數(shù)據(jù)集混合累加電路設(shè)計

編程能力是一種解決問題的能力

arduino用什么語言編程

Java編程和c語言哪一種更有優(yōu)勢_C語言與JAVA的區(qū)別是什么

vb編程語言是做什么用的_VB編程語言有哪些

機器學(xué)習(xí)中最流行的10種編程語言

2021年程序員必學(xué)的五種編程語言

Python是一種什么語言，它可以用來做些什么

Python編程語言屬于什么語言

四種編程語言之間的區(qū)別和聯(lián)系