3.2.2對(duì)象檢測
圖3-5對(duì)象檢測
對(duì)象檢測中的識(shí)別對(duì)象這一任務(wù),通常會(huì)涉及為各個(gè)對(duì)象輸出邊界框和標(biāo)簽。這不同于分類/定位任務(wù)——對(duì)很多對(duì)象進(jìn)行分類和定位,不僅僅是對(duì)個(gè)主體對(duì)象進(jìn)行分類和定位。在對(duì)象檢測中,只有兩個(gè)對(duì)象分類類別,即對(duì)象邊界框和非對(duì)象邊界框。例如,在汽車檢測中,必須使用邊界框檢測所給定圖像中的所有汽車。
如果使用視覺技術(shù)中圖像分類和定位圖像這樣的滑動(dòng)窗口技術(shù),需要將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像上的很多不同物體上。由于卷積神經(jīng)網(wǎng)絡(luò)會(huì)將圖像中的每個(gè)物體識(shí)別為對(duì)象或背景,因此,需要在大量的位置和規(guī)模上使用卷積神經(jīng)網(wǎng)絡(luò),這需要很大的計(jì)算量。
為了解決這一問題,計(jì)算機(jī)視覺技術(shù)研究人員建議使用區(qū)域(Region)這一概念,這樣就會(huì)找到可能包含對(duì)象的“斑點(diǎn)”圖像區(qū)域,運(yùn)行速度就會(huì)大大提高。這是一種基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(R-CNN),并在此基礎(chǔ)上提升算法收斂速度,提出了二次增強(qiáng)的Fast R-CNN,大大提升了對(duì)象檢測速度。
近年來,主要的目標(biāo)檢測算法已經(jīng)轉(zhuǎn)向更快、更高效的檢測系統(tǒng)。這種趨勢在YouOnly Look Once(YOLO)、Single Shot MultiBox Detector(SSD)和基于區(qū)域的全卷積網(wǎng)絡(luò)(R-FCN)算法中尤為明顯。
-
智慧燈桿
+關(guān)注
關(guān)注
1文章
813瀏覽量
11787
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論