吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在超大分辨率的圖片中檢測目標

新機器視覺 ? 來源:新機器視覺 ? 2023-04-16 09:27 ? 次閱讀

本文通過一篇YOLT的文章引出超大分辨率的圖片遇到目標檢測任務該如何處理?此類問題一般出現在遙感領域和醫療影像中居多,我們先來分析超大圖像的目標檢測存在哪些問題,然后學習一下YOLT是如何解決這些問題的,最后結合現有技術探討目前的可行性方案。

1

當超大分辨率圖像邂逅目標檢測任務

曾經有小伙伴問過我針對超大分辨率的圖像如何做目標檢測任務?

我們先思考一下超大分辨率數據在哪些場景中會出現,比如衛星地圖做建筑物、樓宇的檢測:

a10bc8b4-db92-11ed-bfe3-dac502259ad0.jpg

在醫療影像中做病灶體的檢測:

a120883a-db92-11ed-bfe3-dac502259ad0.jpg

無人機航拍圖中做船舶、車輛、房屋等檢測:

a13094f0-db92-11ed-bfe3-dac502259ad0.jpg

是否可以沿用通用框架做該類圖片的目標檢測呢?

輸入如此大分辨率的圖片到網絡中,最直接的問題就是機器的顯存爆掉,無法進行訓練任務。

如果你真的有一個非常牛逼的集群直接訓練大尺寸圖像,最后的預測結果恐怕也不盡如人意,原因出在大尺寸圖像中的目標往往只占5-10個像素點,檢測網絡一旦經過多次下采樣后,這些小目標的特征很難被提取到。

衛星地圖等數據非常稀有珍貴,不像無人駕駛的開源數據有幾十萬幾百萬張的量級,如何高效的利用高質量的訓練圖片也是關鍵所在。

所以直接硬上通用模型檢測出來的效果可能是這樣的,要么伴隨著圖片的resize,目標被縮放沒了;要么基于N×N網格的預測造成密集連續目標的漏檢:

a1455318-db92-11ed-bfe3-dac502259ad0.png

此類任務的難點或者優化方向在哪里?

它的核心在于四個方向:

如何處理高分辨的輸入

如何提高密集小目標檢測

如何解決類別不平衡問題

如何利用少量的訓練數據

下面我們通過一篇名為You Only Look Twice的文章來分析上述幾個問題,名稱有點蹭熱度的嫌疑哦,不過誰讓YOLO系列那么火,大家都喜歡在它的框架上改改發文章呢!

2

You Only Look Twice

《Rapid Multi-Scale Object Detection In Satellite Imagery》這篇文章描述了大尺寸圖像目標檢測的常規方法,總的來說就是對超大分辨率的圖像進行滑窗裁剪成多個子圖,然后對每一個子圖進行目標檢測,最后將所有子圖的結果拼接后進行NMS過濾。

數據端

對超大分辨率圖片進行滑窗裁剪,如下圖所示,一個16000×16000像素的圖片,采用416×416像素的滑窗,最后生成約1500個子圖。

a159e09e-db92-11ed-bfe3-dac502259ad0.png

文章指出在滑窗裁剪的時候必須有15%的重疊區域,原因是如果一個目標剛好處于窗口邊緣被切分成2塊,本身目標所占像素就少又被截斷會造成更加難以檢測。但是重復部分會帶來同一個目標出現多個檢測框的問題,目前通過將所有子圖的檢測結果合并起來采用NMS處理進行過濾。

a1749f92-db92-11ed-bfe3-dac502259ad0.png

在衛星、遙感、航拍等圖片中,目標物體往往存在方向信息,如何提高目標檢測的旋轉不變性呢?在YOLT中通過數據增廣的方式旋轉圖片生成更多形狀的物體從而緩解問題。但是小編認為該方法治標不治本,輸出結果仍然是規則的矩形框,一旦遇到長條形物體,比如輪船。預測的矩形框會引入很多冗余區域。可以嘗試在損失函數中增加旋轉角進行學習。

a193513a-db92-11ed-bfe3-dac502259ad0.jpg

網絡端

基于YOLOv2的結構做了一些改進,在YOLO系列或者很多檢測網絡都進行了32倍的下采樣,但是在遙感地圖等超大分辨率圖片中,目標物體所占像素本身就很少,經過32倍下采樣后,基本無法有效檢測。所以YOLT減少了下采樣的比例收縮到16倍并增加網絡的層數提供特征提取能力。

文章借助YOLOv2中的PassThrough層,融合深淺特征圖的特征目的是提升對小目標的檢測效果。當然這一操作完全可以考慮由PAN替代,在FPN上采樣融合的特征金字塔之后,又增加了一個下采樣融合的特征金字塔。

本文并沒有提到類別不平衡問題,但是任何目標檢測任務其實都存在前后背景的不平衡,一般會從三種方法進行考慮,其一是做數據的上采樣和下采樣來平衡不同類別之間的數據量;其二是采用某些數據增廣的手段來增多前景目標在一張圖像中的占比;其三是通過設計損失函數通過權重控制不同類別的優化力度。

3

如何處理高分辨的輸入圖像?

較常見的方式就是像上述文章提到的對一張超大分辨率的圖片切割成多個子圖,但是在這一過程中存在幾個問題,比如:

目標位于切割邊緣怎么辦?

切割的圖片大小如何設置?

目標切割的問題在上面已經提過,可以用重疊切割的方法解決目標被截斷的問題。

假設數據集的圖片尺寸不同的前提下,我們可以從結果端反向思考切割尺寸的問題,一般會設置一個固定的子圖尺寸比如416×416,但是原圖可能無法剛好切割成整數個子圖,所以對最邊緣的子圖可以采用letterbox的方式縮放到416的尺寸,相比直接resize能夠保留物體特征。

4

如何提高密集小目標檢測?

在目標檢測領域中,小目標檢測一直都是其中一個難點。針對該問題,近些年也提出了不少優化的方式:

圖像金字塔進行多尺度訓練。將原始圖像生成多個不同分辨率的圖像金字塔,再對每層金字塔用固定輸入分辨率的分類器在該層滑動來檢測目標。不過此方法需要對圖像做多次的特征提取,速度太慢。該方法也有改進版本,如SNIP網絡只訓練合適尺寸的目標,當真值的尺寸和Anchor接近時才訓練檢測器,過大過小的均丟棄。

特征金字塔融合淺層和深層信息,如FPN和PAN等。通過各層融合的方式從淺層網絡中學習更多的細節特征,從深層網絡中學習更多的語義特征。

設計與小目標尺寸匹配的Anchor。不同任務的檢測目標尺寸均有差異,可以根據先驗知識,采用手工或者聚類的方式離線得到一定個數的Anchor。

采用空洞卷積減少下采樣次數,其目的是考慮下采樣會丟失圖片的部分信息,而空洞卷積能夠在不增加參數量的同時具有更大的感受野,提供降低采樣次數的一種思路。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40572
  • 分辨率
    +關注

    關注

    2

    文章

    1072

    瀏覽量

    42037

原文標題:如何在超大分辨率的圖片中檢測目標?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何提高透鏡成像的分辨率

    透鏡成像分辨率是指透鏡系統能夠分辨的最小細節的能力。提高透鏡成像分辨率對于許多應用領域,如顯微鏡、望遠鏡、相機等,都是至關重要的。以下是一些提高透鏡成像分辨率的方法: 1. 減少像差
    的頭像 發表于 12-25 16:54 ?450次閱讀

    如何選擇掃描電鏡的分辨率

    選擇掃描電鏡的分辨率需要綜合考慮多個因素。首先是研究目的。如果只是需要對樣品的大致形貌進行觀察,例如查看較大顆粒的分布或者材料表面的宏觀缺陷,較低分辨率(如3-10nm)可能就足夠了。但如果要觀察
    的頭像 發表于 12-25 14:29 ?247次閱讀
    如何選擇掃描電鏡的<b class='flag-5'>分辨率</b>?

    HDMI接口支持哪些視頻分辨率

    支持最大分辨率4K(3840x2160)@30Hz。這意味著在4K分辨率下,HDMI 1.4能以每秒30幀的速度傳輸視頻。 同時支持1080p分辨率下的高刷新,最高可達120Hz。
    的頭像 發表于 11-27 14:14 ?3815次閱讀

    視頻處理器的分辨率是如何管理的

    ? ? 隨著電子應用技術和消費市場的不斷發展,LED顯示屏的顯示單元之間的間距正在逐漸縮小,然而,顯示屏的整體面積卻在不斷擴大。為了滿足這一趨勢下對超大輸出分辨率的需求,視頻處理器和拼接器變得
    的頭像 發表于 11-11 15:25 ?343次閱讀
    視頻處理器的<b class='flag-5'>分辨率</b>是如何管理的

    提高SAR ADC的分辨率

    電子發燒友網站提供《提高SAR ADC的分辨率.pdf》資料免費下載
    發表于 10-25 09:11 ?0次下載
    提高SAR ADC的<b class='flag-5'>分辨率</b>

    什么是高分辨率示波器?它有哪些優勢?

    分辨率示波器是一種在信息與系統科學相關工程與技術領域中廣泛應用的科學儀器,其設計旨在提供更高的信號分辨率和更精細的信號分析能力。以下是對高分辨率示波器的詳細解析,包括其定義、優勢以及可能涉及的多個方面。
    的頭像 發表于 08-08 11:49 ?1135次閱讀

    Moritex 5X 高分辨率遠心鏡頭 助力晶圓檢測

    5X高分辨率遠心鏡頭工業鏡頭相當于機器視覺系統中的眼睛,它能將目標成像在圖像傳感器的光敏面上,對視覺圖像成像發揮著重要作用。今天我們來看看Moritex的5X高分辨率遠心鏡頭
    的頭像 發表于 07-27 10:00 ?373次閱讀
    Moritex 5X 高<b class='flag-5'>分辨率</b>遠心鏡頭 助力晶圓<b class='flag-5'>檢測</b>

    VR顯示器分辨率的選擇

    一、VR顯示器分辨率的重要性 1.1 分辨率與視覺體驗 分辨率是指顯示器上能夠顯示的像素點的數量,通常用水平像素數×垂直像素數來表示。在VR顯示器中,分辨率直接影響到用戶的視覺體驗。高
    的頭像 發表于 07-08 10:29 ?1265次閱讀

    伺服編碼器分辨率是什么意思

    伺服編碼器分辨率是指編碼器能夠檢測到的最小角度或位置變化。在伺服系統中,編碼器用于測量電機軸或負載的位置和速度,以實現精確控制。分辨率越高,編碼器能夠檢測到的最小變化越小,從而實現更精
    的頭像 發表于 06-17 11:16 ?1088次閱讀

    像素大小和相機分辨率

    由于表面積的增加而能夠收集更多的光子。這允許更多的光子轉化為光電子,從而提高傳感器的靈敏度。但是,這是以分辨率為代價的。 較小的像素能夠提供更高的空間分辨率,但每個像素捕獲的光子更少。為了克服這個問題,可以
    的頭像 發表于 03-20 06:29 ?847次閱讀
    像素大小和相機<b class='flag-5'>分辨率</b>

    基于CNN的圖像超分辨率示例

    考慮單個低分辨率圖像,首先使用雙三次插值將其放大到所需的大小,這是執行的唯一預處理。將插值圖像表示為Y。我們的目標是從Y中恢復與真實高分辨率圖像X盡可能相似的圖像F (Y) 。
    的頭像 發表于 03-11 11:40 ?761次閱讀
    基于CNN的圖像超<b class='flag-5'>分辨率</b>示例

    電流探頭的分辨率和靈敏度有關系嗎?

    當談及電流探頭,分辨率和靈敏度是兩個重要的概念。盡管它們表示不同的特性,但在某些方面確實存在關聯。 首先,讓我們來看看分辨率。在電流測量中,分辨率指的是探頭能夠分辨
    的頭像 發表于 03-08 09:40 ?1165次閱讀
    電流探頭的<b class='flag-5'>分辨率</b>和靈敏度有關系嗎?

    華為pockets屏幕分辨率是多少

    華為Pocket S的內屏分辨率是2790×1188,外屏分辨率為340×340。該手機采用了6.9英寸的柔性OLED屏幕,支持120Hz刷新、1440Hz高頻PWM調光,色彩表現達到10.7億色,同時還配備了防反光納米光學膜
    的頭像 發表于 03-06 17:37 ?1259次閱讀

    psoc的規格再驅動lcd屏的時候,是否可以驅動RGB/RGB666的屏?支持的最大分辨率是多少?

    請教一下,psoc的規格再驅動lcd屏的時候,是否可以驅動RGB/RGB666的屏,如果可以的話,那支持的最大分辨率是多少?支持那些接口類型?規格書上的segment 和這個的轉換關系是什么?
    發表于 03-06 06:24

    編碼器分辨率是什么意思 編碼器分辨率和脈沖數的關系

    按照編碼器支持的分辨率可以把編碼器分成標清編碼器、高清編碼器、全高清編碼器,分辨率越高幀率越高視頻就越清楚。 1.編碼器的分辨率是什么意思 編碼器的分辨率是指編碼器以每旋轉360度提供
    的頭像 發表于 02-21 18:07 ?4539次閱讀
    編碼器<b class='flag-5'>分辨率</b>是什么意思 編碼器<b class='flag-5'>分辨率</b>和脈沖數的關系
    好望角百家乐官网的玩法技巧和规则| 永利高百家乐官网会员| 百家乐官网代打是真的吗| 百家乐官网透明出千牌靴| 百家乐真人娱乐注册| 太阳城7778886| 滨海县| 功夫百家乐官网的玩法技巧和规则| 百家乐必胜密| 东莞水果机遥控器| 百家乐官网庄家抽水| 风水24山组成| 钱大发888游戏下载| 百家乐官网视频台球游戏| 百家乐官网计划工具| 威尼斯人娱乐城反水| 豪博百家乐官网现金网| 德州扑克怎么比大小| 百家乐8点直赢| 金字塔百家乐官网的玩法技巧和规则 | 新昌县| 大发百家乐现金网| 大发888游戏客户端| 百家乐官网和的几率| 博之道百家乐的玩法技巧和规则 | 7人百家乐桌子| 沈阳盛京棋牌下载| 宝马会百家乐官网娱乐城| 赌博百家乐的玩法技巧和规则| 丰镇市| 澳门百家乐破解方法| 吉木萨尔县| 百家乐如何打公式| 3D乐财网| 做生意风水门面要求| 盈丰| 做生意适合放什么花招财| 波音娱乐城送彩金| 正品百家乐官网网站| 明升娱乐| 克拉克百家乐试玩|