訓(xùn)練一個(gè)高準(zhǔn)確率的檢測(cè)模型需要大量精細(xì)標(biāo)注的圖片數(shù)據(jù),其成本很高。本文提出了一種弱監(jiān)督協(xié)同學(xué)習(xí)框架,僅使用粗略標(biāo)簽的圖片訓(xùn)練目標(biāo)檢測(cè)模型,測(cè)試結(jié)果顯示其定位精確率和檢測(cè)準(zhǔn)確率均顯著優(yōu)于目前最先進(jìn)的方法。
目標(biāo)檢測(cè)是機(jī)器視覺(jué)的基本問(wèn)題,在視頻監(jiān)控、無(wú)人駕駛等場(chǎng)景都有廣泛應(yīng)用。隨著深度學(xué)習(xí)的興起,近年來(lái)涌現(xiàn)了大量?jī)?yōu)秀的目標(biāo)檢測(cè)模型。然而,訓(xùn)練一個(gè)高準(zhǔn)確率的檢測(cè)模型需要大量的以包圍框形式精細(xì)標(biāo)注的圖片數(shù)據(jù)作為模型監(jiān)督條件,需要花費(fèi)大量的人力物力。
同時(shí),我們可以從互聯(lián)網(wǎng)輕松獲取海量粗標(biāo)注的圖片,如利用Flickr的標(biāo)簽。因此,研究如何在弱監(jiān)督條件下,即僅提供粗略圖片類(lèi)別標(biāo)注,訓(xùn)練目標(biāo)檢測(cè)模型,具有重要的意義。已有學(xué)者探索了基于多示例學(xué)習(xí)構(gòu)建弱監(jiān)督條件下的目標(biāo)檢測(cè)模型學(xué)習(xí)方法,但是模型的精確度仍然難以令人滿(mǎn)意。
論文:Collaborative Learning for Weakly Supervised Object Detection
論文鏈接:https://arxiv.org/abs/1802.03531
本論文提出了一種弱監(jiān)督協(xié)同學(xué)習(xí)(WSCL)的框架,將弱監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)和強(qiáng)監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)連接成為一個(gè)整體網(wǎng)絡(luò),通過(guò)一致性損失約束強(qiáng)監(jiān)督和弱監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)具有相似的預(yù)測(cè)結(jié)果,通過(guò)強(qiáng)監(jiān)督和弱監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)間部分特征共享保證兩個(gè)網(wǎng)絡(luò)在感知水平上的一致性,從而實(shí)現(xiàn)強(qiáng)監(jiān)督和弱監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)的協(xié)同增強(qiáng)學(xué)習(xí)。弱監(jiān)督協(xié)同學(xué)習(xí)框架結(jié)構(gòu)如下圖所示:
弱監(jiān)督協(xié)同學(xué)習(xí)框架(以目標(biāo)檢測(cè)為例)
基于上述弱監(jiān)督協(xié)同學(xué)習(xí)框架,論文設(shè)計(jì)了一個(gè)端到端的弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)(WSCDN),弱監(jiān)督和強(qiáng)監(jiān)督的檢測(cè)模塊分別采用了目前最優(yōu)秀WSDDN和RCNN網(wǎng)絡(luò)結(jié)構(gòu)。其網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。
弱監(jiān)督協(xié)同目標(biāo)檢測(cè)學(xué)習(xí)模型
在每次學(xué)習(xí)迭代中,整個(gè)目標(biāo)檢測(cè)網(wǎng)絡(luò)只將圖像級(jí)標(biāo)簽作為弱監(jiān)督,并且通過(guò)預(yù)測(cè)一致性損失并行優(yōu)化強(qiáng)監(jiān)督和弱監(jiān)督檢測(cè)網(wǎng)絡(luò)。
下圖是WSCDN訓(xùn)練時(shí),強(qiáng)監(jiān)督和弱監(jiān)督檢測(cè)網(wǎng)絡(luò)準(zhǔn)確率的變化曲線(xiàn)。
可以看出,在訓(xùn)練的初始階段,弱監(jiān)督檢測(cè)網(wǎng)絡(luò)準(zhǔn)確率高于強(qiáng)監(jiān)督檢測(cè)網(wǎng)絡(luò)。隨著協(xié)同訓(xùn)練輪次的增多,兩者的準(zhǔn)確率均逐漸上升,但強(qiáng)監(jiān)督檢測(cè)網(wǎng)絡(luò)提升的速度更快,并很快超越弱監(jiān)督檢測(cè)網(wǎng)絡(luò)。在整個(gè)訓(xùn)練過(guò)程中,兩類(lèi)檢測(cè)網(wǎng)絡(luò)相互協(xié)同,達(dá)到了共同提高的效果。
我們比較了弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)與其他相關(guān)弱監(jiān)督檢測(cè)方法在PASCAL VOC 2007測(cè)試圖片上的效果(見(jiàn)下圖)。其中,IW是單獨(dú)訓(xùn)練得到的弱監(jiān)督檢測(cè)模型,CSS是分開(kāi)迭代訓(xùn)練得到的強(qiáng)監(jiān)督檢測(cè)模型,CLW和CLS分別是通過(guò)弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)得到的強(qiáng)監(jiān)督和弱監(jiān)督檢測(cè)網(wǎng)絡(luò)??梢钥闯?,我們的強(qiáng)監(jiān)督檢測(cè)網(wǎng)絡(luò)明顯優(yōu)于其他檢測(cè)器網(wǎng)絡(luò),表現(xiàn)在可以得到更全面和更緊湊的包圍框預(yù)測(cè)。
我們用PASCAL VOC 2007和PASCAL VOC 2012數(shù)據(jù)集進(jìn)行了測(cè)試。結(jié)果表明,弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)的定位精確率以及檢測(cè)準(zhǔn)確率均顯著優(yōu)于目前最先進(jìn)的方法。
弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)與其他目前最先進(jìn)的方法在PASCAL VOC 2007 測(cè)試數(shù)據(jù)集上檢測(cè)精確度的比較(AP) (%)
弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)與其他目前最先進(jìn)的方法在PASCAL VOC 2007 trainval set 上定位精確度的比較(CorLoc) (%)
弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)與其他目前最先進(jìn)的方法在PASCAL VOC 2012 測(cè)試數(shù)據(jù)集上檢測(cè)精確度的比較(AP) (%)
弱監(jiān)督協(xié)同檢測(cè)網(wǎng)絡(luò)與其他目前最先進(jìn)的方法在PASCAL VOC 2012 trainval set 上定位精確度的比較(CorLoc) (%)
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11187瀏覽量
103871 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7600瀏覽量
89251 -
無(wú)人駕駛
+關(guān)注
關(guān)注
98文章
4090瀏覽量
121012
原文標(biāo)題:IJCAI Oral:弱監(jiān)督實(shí)現(xiàn)精確目標(biāo)檢測(cè),上交大提出協(xié)同學(xué)習(xí)框架
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
適用于任意數(shù)據(jù)模態(tài)的自監(jiān)督學(xué)習(xí)數(shù)據(jù)增強(qiáng)技術(shù)
![適用于任意數(shù)據(jù)模態(tài)的自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>數(shù)據(jù)<b class='flag-5'>增強(qiáng)</b>技術(shù)](https://file1.elecfans.com/web2/M00/A2/E2/wKgaomT1O8mAPgu4AABG10TpcTQ746.png)
深非監(jiān)督學(xué)習(xí)-Hierarchical clustering 層次聚類(lèi)python的實(shí)現(xiàn)
如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類(lèi)問(wèn)題?
基于半監(jiān)督學(xué)習(xí)框架的識(shí)別算法
你想要的機(jī)器學(xué)習(xí)課程筆記在這:主要討論監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)
如何用Python進(jìn)行無(wú)監(jiān)督學(xué)習(xí)
機(jī)器學(xué)習(xí)算法中有監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)的區(qū)別
最基礎(chǔ)的半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個(gè)概念
![半<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>最基礎(chǔ)的3個(gè)概念](https://file.elecfans.com/web1/M00/CD/B8/o4YBAF-fvqyAGEj-AAAfyv30akw806.png)
為什么半監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來(lái)?
半監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好
深度學(xué)習(xí):基于語(yǔ)境的文本分類(lèi)弱監(jiān)督學(xué)習(xí)
機(jī)器學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域
![機(jī)器<b class='flag-5'>學(xué)習(xí)</b>中的無(wú)<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>應(yīng)用在哪些領(lǐng)域](https://file.elecfans.com//web2/M00/2E/1A/poYBAGHozlqARapuAABuqubGspA277.jpg)
自監(jiān)督學(xué)習(xí)的一些思考
![自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的一些思考](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
融合零樣本學(xué)習(xí)和小樣本學(xué)習(xí)的弱監(jiān)督學(xué)習(xí)方法綜述
![融合零樣本<b class='flag-5'>學(xué)習(xí)</b>和小樣本<b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>弱</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>方法綜述](http://file.elecfans.com/web1/M00/F1/DE/o4YBAGC24DOAHECBAAAARmu_22A208.png)
評(píng)論