近日, 在第二屆視覺對話競賽Visual Dialogue Challenge中,阿里AI擊敗了微軟、首爾大學(xué)等十支參賽隊伍,獲得冠軍。
(阿里AI在視覺對話競賽中得冠)
據(jù)了解,視覺對話競賽由美國佐治亞理工大學(xué)、Facebook人工智能實驗室(FAIR)等機構(gòu)聯(lián)合全球視覺技術(shù)領(lǐng)域頂級學(xué)術(shù)會議CVPR發(fā)起,是目前視覺對話領(lǐng)域最權(quán)威的競賽之一。
該競賽要求參賽的AI在看完近萬張圖片后,回答出人類對于任一圖片任一內(nèi)容的提問。競賽結(jié)果顯示,阿里AI以74.57%的準確率獲得冠軍,將上一屆比賽的紀錄提高了16.82%。在相同的數(shù)據(jù)集中,人類的準確率僅為64.27%。
傳統(tǒng)的視覺AI主要針對目標的檢測和識別,例如識別出圖片是否是一只貓,但對復(fù)雜場景中目標之間的邏輯關(guān)系理解、推理能力較弱,無法回答“這只貓旁邊的男生穿了什么顏色的衣服”等復(fù)雜問題,也難以將圖片信息轉(zhuǎn)化為人類理解的語言輸出。
阿里AI的突破在于提出了“遞歸探索對話模型”,綜合集成了圖像識別、關(guān)系推理與自然語言理解三大能力,它通過高效利用標注信息學(xué)習(xí)出模仿人類認知復(fù)雜場景的思維方式,能夠有效識別圖片里的實體以及它們之間的關(guān)系,推理出圖片所描述的事件內(nèi)容,并通過對上下文進行有效建模,理解人類提出的問題及真實意圖,給出自然準確的回復(fù)。
視覺對話是近年來快速崛起的AI研究方向,目的在于教會機器用自然語言與人類討論視覺內(nèi)容。如果說視覺識別技術(shù),讓機器具備了視覺能力;那么視覺對話技術(shù),則使得機器擁有了對真實視覺世界的理解與推斷能力,意味著AI的認知能力將邁上新的臺階。
據(jù)了解,這項技術(shù)未來將被應(yīng)用在人機交互諸多場景:地震后在廢墟中尋找幸存者的救援機器人,能夠更加及時、高效地綜合指揮指令和場景信息作出行動;視障人士可以通過提問阿里AI,理解網(wǎng)絡(luò)照片中的內(nèi)容,了解自身所處的周圍環(huán)境;無人駕駛車輛對影響因子的意圖理解會更為準確,乘客的乘坐體驗更好。
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270343 -
阿里巴巴
+關(guān)注
關(guān)注
7文章
1619瀏覽量
47524
原文標題:不忘初心 奮勇當(dāng)先——光華科技連續(xù)9年成為中國電子電路專用化學(xué)品民族企業(yè)No.1
文章出處:【微信號:ruziniubbs,微信公眾號:PCB行業(yè)工程師技術(shù)交流】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能對話框
![](https://file1.elecfans.com/web3/M00/04/8E/wKgZO2d2AcyAAoIvAAQX5x5EcT0217.jpg)
如何在STM32f4系列開發(fā)板上部署STM32Cube.AI,
![](https://file1.elecfans.com/web1/M00/F5/22/wKgZoWc2_7eATX_qAA5eFhigbj4701.jpg)
莫拉維克悖論與多模態(tài)AI:邁向機器人認知的新時代
AI大模型在圖像識別中的優(yōu)勢
AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
人工智能ai4s試讀申請
基于迅為RK3588開發(fā)板的AI圖像識別方案
基于瑞薩RZ/V2H AI微處理器的解決方案:高性能視覺AI系統(tǒng)
![基于瑞薩RZ/V2H <b class='flag-5'>AI</b>微處理器的解決方案:高性能<b class='flag-5'>視覺</b><b class='flag-5'>AI</b>系統(tǒng)](https://file1.elecfans.com/web2/M00/F7/28/wKgZomaD21SAbKA6AADrJjvRsaM578.png)
聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)
梯云物聯(lián)|AI提高物聯(lián)網(wǎng)感知能力:讓電梯更智能、安全!
![梯云物聯(lián)|<b class='flag-5'>AI</b>提高物聯(lián)網(wǎng)感<b class='flag-5'>知能力</b>:讓電梯更智能、安全!](https://file1.elecfans.com//web2/M00/EB/23/wKgZomZdPTKAGG6hAAFBDksIX4M610.jpg)
【AIBOX快速入門】2步玩轉(zhuǎn)AI對話
![【AIBOX快速入門】2步玩轉(zhuǎn)<b class='flag-5'>AI</b><b class='flag-5'>對話</b>](https://file.elecfans.com/web2/M00/10/E9/pYYBAGEfInyAb9dQAABH4pzjonI981.jpg)
開發(fā)者手機 AI - 目標識別 demo
搭載星火認知大模型的AI鼠標:一鍵呼出AI助手,辦公更高效
![搭載星火<b class='flag-5'>認知</b>大模型的<b class='flag-5'>AI</b>鼠標:一鍵呼出<b class='flag-5'>AI</b>助手,辦公更高效](https://file1.elecfans.com//web2/M00/C5/A3/wKgZomYA9O6AROfgAADS60_oYzQ45.jpeg)
評論