吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SLAM/SfM相似非回環場景應該如何處理?

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-09-20 15:15 ? 次閱讀

作者:泡椒味的口香糖

0. 筆者個人體會

相似結構一直是SLAM和SfM中很難處理卻又不得不處理的問題,如果機器人遇到了非常相似但實際不同的結構,很容易因為匹配數量足夠多而引發假陽性回環和重建失敗。傳統方法更多的還是利用匹配數量的閾值或者和其他幾何關系的比值閾值來判斷,這種方法在遇到高對稱結構時很容易失敗。

今天筆者將為大家帶來這個問題新的解決思路,也就是ICCV 2023 Oral提出的Doppelgangers,能夠自動判斷兩個視圖是相同的,還是僅僅是相似的。這個方案實際上是將視覺消歧問題建模為圖像對上的二分類任務,并開發了基于學習的解決方案和數據集。

1. 效果展示

以下是一些典型的相似結構,即便是使用人眼觀看,也很容易認為是相同場景。而在SLAM和SfM遇到這類場景時,很容易觸發假陽性回環而導致跟蹤丟失或重建失敗。

Doppelgangers這篇文章主要解決的就是這類場景下的匹配和重建問題,即便用來重建的場景具有高度對稱和相似的結構,仍然可以進行完整的三維重建,不會憑空多或者少一些結構。

618d9074-569d-11ee-939d-92fbcf53809c.png

61a4543a-569d-11ee-939d-92fbcf53809c.png

2. 摘要

我們考慮視覺消歧任務,即判斷一對視覺相似的圖像是否描繪了相同或不同的三維表面(例如,對稱建筑物的同側或對側)。虛假圖像匹配,即兩幅圖像觀察到不同但視覺上相似的3D表面,對人類區分具有挑戰性,也會導致3D重建算法產生錯誤的結果。我們提出了一種基于學習的視覺消歧方法,將其建模為圖像對上的二分類任務。為此,我們為該問題引入了一個新的數據集Doppelgangers,該數據集包含了具有真實標簽的相似結構的圖像對。我們還設計了一種網絡架構,將局部關鍵點和匹配的空間分布作為輸入,從而可以更好地對局部和全局線索進行推理。我們的評估表明,我們的方法可以在困難的情況下區分誤匹配,并且可以集成到SfM流水線中,以產生正確的、無二義性的三維重建。

3. 算法解析

現在一步步來拆解任務:我們希望在做SLAM和SfM時,即便遇到了結構非常相似的場景,也能夠正確進行三維重建和跟蹤,不能出現誤匹配導致重建結果突然多了一塊或少了一塊,更不能出現假陽性回環。

具體任務描述:

給定兩幅非常相似的圖像,判斷它們是同一個結構的同一個表面,還是兩個不同的3D結構(作者將其稱為doppelgangers)。主要發生在對稱建筑物、重復視覺元素、以及多個相同地標場景中。

分析發現,雖然從高度對稱建筑拍攝的兩幅圖像整體很相似,很難直接通過圖像對來進行正負判別,但是它內部還是有一些細節是不同的。這些細節所在的區域在進行圖像匹配時的匹配關系很少,利用這種細微差異就可以區分圖像。其實這樣很符合人類"找不同"的思路。

基于這個發現,作者就提出了一種基于學習的方法來消除視覺歧義,并且還公開了一個具有相似結構的數據集,數據集還有GT標簽

這個相似場景識別算法的原理是,首先使用RANSAC估計基礎矩陣并過濾異常匹配(具體實驗是直接使用LoFTR+RANSAC計算匹配),將原圖、提取的特征點、匹配到的特征點輸入到網絡中,輸出為相似圖像的概率,將相似性識別轉換為一個二分類問題。

這個算法的思想是使用關鍵點和匹配位置為網絡提供信息,這樣網絡不僅知道哪些關鍵點被匹配了,也可以知道哪些關鍵點沒有匹配,這樣對應的區域可能就代表信息缺失或者不同目標,相當于利用了關鍵點和匹配的空間分布信息。很明顯,視覺上具有相似結構區域的匹配會更稠密,但不同結構的區域匹配更稀疏。

而且為了更好得比較不同結構區域,作者還對輸入圖像對進行了幾何對齊,也就是估計仿射變換,然后warp圖像和二值mask。當然,這個對齊不一定特別準,只不過希望能夠更好得聯系將兩個重疊區域。

到具體訓練這一塊,作者還使用了Focal loss。這個也很容易理解,相似結構的特征點匹配肯定是正負樣本不平衡的,使用Focal loss可以提高難分樣本的貢獻。

4. 實驗

用來做二分類的網絡結構很簡單,就是3個殘差模塊,一個平均池化,再加上一個全連接層。也僅僅訓練了10個epoch,batch size設置為16,學習率從0.0005降低到0.000005。

實驗主要是在他們提出的Doppelgangers數據集上評估消除視覺歧義的性能,然后將訓練的圖像二分類器集成到SfM中,通過重建效果來評估消歧性能,最后搞了一個消融實驗來證明每個模塊都是有用的。

首先是僅使用局部特征匹配來預測圖像對是否為正(真)的匹配,對比的baseline包括SIFT+RANSAC、LoFTR、以及DINO-ViT(自監督SOTA分類/分割器)。作者使用的匹配方式包括兩種:( 1 )對幾何驗證后的匹配數量進行閾值化處理;( 2 )對匹配數量與關鍵點數量的比值進行閾值化處理。( 2 )背后的思想是,如果相對于關鍵點的數量,有很少的匹配,則很可能是誤匹配。作者訓練的模型AP為95.2 %,ROC AUC為93.8 %。DINO結果不太好,主要是因為它生成的特征很適合語義分類任務,但不適合視覺消歧。

61e80f22-569d-11ee-939d-92fbcf53809c.png

測試的圖像對和對應的正匹配概率,這個定性對比還是很詳細的,實驗的場景很多。左欄表示負對匹配關系(錯誤),右欄表示正對(正確)。比較亮眼的是,在不同光照、視角變化、天氣變化等挑戰性情況下,也可正確分類正負匹配關系。

后面就開始搞三維重建了,作者將他們訓練的二分類器集成到COLMAP中,以此來評估在重復/對稱場景中的三維重建效果。使用的landmark有兩類,包含13個由于對稱和重復結構而難以重建的landmark,還有與訓練數據有顯著差異的3個具有重復結構的場景,主要是為了測試泛化性。

下面這個表就是SfM的重建結果,第二列代表數據集中的場景數量,其他的√和代表是否重建成功,是否成功是與谷歌地球中相應結構對比得到的(評估三維重建效果的新點?)。

621846c4-569d-11ee-939d-92fbcf53809c.png

下面是直接使用COLMAP重建的模型和作者提出方法重建效果的對比。顯然,直接使用COLMAP會憑空產生很多多余的塔樓、穹頂等結構。但是作者提出的方法可以很好得消除這種對稱相似結構的"語義歧義",從而重建完整的三維模型。

622c8f80-569d-11ee-939d-92fbcf53809c.png

最后是一個消融實驗,就沒啥可說的了,主要對比了使用不同的網絡結構做二分類器、書否有數據增強,以及不同網絡輸入帶來的性能對比。

6249b1f0-569d-11ee-939d-92fbcf53809c.png

5. 總結

Doppelgangers是解決特定任務的一篇文章,實現了相似結構的二分類,解決的問題很重要。雖然Doppelgangers的實驗更多的面向圖像匹配和SfM,但筆者個人覺得也很容易應用到SLAM場景中,感興趣的小伙伴可以做進一步的嘗試。

編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28642

    瀏覽量

    208423
  • SLAM
    +關注

    關注

    23

    文章

    426

    瀏覽量

    31931
  • 分類器
    +關注

    關注

    0

    文章

    152

    瀏覽量

    13225
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24834

原文標題:ICCV 2023 oral | 一文看懂SLAM/ SfM遇到相似非回環場景應該如何處理

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    貿澤電子開售醫療用Sensirion SFM3003和SFM3013流量計

    貿澤電子 (Mouser Electronics) 即日起開售Sensirion的SFM全系列數字流量計,包括SFM3003和SFM3013流量計。
    發表于 12-21 14:05 ?2080次閱讀
    貿澤電子開售醫療用Sensirion <b class='flag-5'>SFM</b>3003和<b class='flag-5'>SFM</b>3013流量計

    淺談SLAM回環檢測技術

    回環的,對于SLAM來說也可以通過對比當前幀與過去關鍵幀的相似度,如相似度超過某一閥值時就可以被認為是檢測到回環。現在,問題的關鍵就在于如
    發表于 10-23 17:47

    SLAM技術的應用及發展現狀

    應用行業也可分為兩大類,即工業領域和商業領域。商業用途方面,目前應用最為成熟的應該是掃地機行業,而掃地機也算機器人里最早用到SLAM技術這一批了,國內的科沃斯、塔米掃地機、嵐豹掃地機通過用SLAM算法
    發表于 12-06 10:25

    讓機器人完美建圖的SLAM 3.0到底是何方神圣?

    圖引擎,讓機器人在復雜、大面積的場景下也能輕松應對,穩定發揮,完成定位導航任務。 傳統SLAMSLAM 3.0的建圖對比:    -建圖精度高,圖優化式建圖  - 主動閉環修正  - 建圖穩定、不
    發表于 01-21 10:57

    SLAM大法之回環檢測

    SLAM 3.0 算是提升機器人回環檢測能力的一大突破。  SLAM 3.0采用圖優化的方式進行建圖,進行了圖片集成與優化處理,當機器人運動到已經探索過的原環境時,
    發表于 03-06 15:38

    超全SLAM技術及應用介紹

    運動恢復結構(SfM)和 SLAM 所解決的問題非常相似,但 SfM 傳統上是以離線形式進行的,而 SLAM 則已經慢慢走向了低功耗/實時/
    的頭像 發表于 11-22 14:34 ?1.8w次閱讀
    超全<b class='flag-5'>SLAM</b>技術及應用介紹

    VIL-SLAM系統可實現獲得更好的回環約束

    本文提出的立體視覺+慣導+激光雷達的SLAM系統,在比如隧道一些復雜場景下能夠實現良好性能。VIL-SLAM通過將緊密耦合的立體視覺慣性里程計(VIO)與激光雷達建圖和激光雷達增強視覺環路閉合相結合
    發表于 02-18 17:59 ?2365次閱讀
    VIL-<b class='flag-5'>SLAM</b>系統可實現獲得更好的<b class='flag-5'>回環</b>約束

    一種適用于動態場景SLAM方法

    的目標檢測算法引入到經典ORB_SLAM2方法中,將特征點分為潛在動態特征點和潛在動態特征點,基于潛在動態特征點計算運動模型,篩選岀應用場景中的靜態特征點并實現位姿跟蹤,利用
    發表于 03-18 10:39 ?21次下載
    一種適用于動態<b class='flag-5'>場景</b>的<b class='flag-5'>SLAM</b>方法

    移動機器人視覺SLAM回環檢測原理、現狀及趨勢

    目前視覺SLAM回環檢測主要方式有傳統的詞袋模型以及基于概率和詞袋模型的一些改進算法,但是傳統方式依然存在過多的人工干預,對于場景中動態對象的處理不是十分理想,并且計算量較大,響應比較
    的頭像 發表于 11-09 12:38 ?2097次閱讀

    關于視覺SLAM直接法的介紹

    而關于SLAM,它是英文“同時定位與建圖”的縮寫。而有時候,我們還會聽到VO,SfM等概念,而因此容易混淆。
    的頭像 發表于 11-30 09:22 ?1130次閱讀

    Global SfM和ncremental SfM知識講解

    Sfm 可以分為以下幾類:Global SfM、Incremental SfM、Hybrid SfM、Distributed SfM,這里主
    的頭像 發表于 12-30 09:16 ?2007次閱讀

    OV2SLAM(高速視覺slam)簡析

    視覺里程計最近幾年越來越受到學術界以及工業界的認可,以ORB和VINS為代表的視覺SLAM已經可以滿足絕大多數場景,而OV2SLAM在其他VSLAM中脫穎而出,其實時性以及具體的回環
    的頭像 發表于 03-21 17:16 ?1717次閱讀

    基于特征點的SfM在弱紋理場景下的表現

    SfM是指給定一組無序圖像,恢復出相機位姿以及場景點云。通用場景下的SfM效果已經很好,而且COLMAP這類框架也很好用。但是弱紋理和無紋理場景
    的頭像 發表于 08-21 09:22 ?2054次閱讀
    基于特征點的<b class='flag-5'>SfM</b>在弱紋理<b class='flag-5'>場景</b>下的表現

    3D重建的SLAM方案算法解析

    GO-SLAM主要還是基于NeRF進行稠密重建,可以發現相較于NICE-SLAM這些SOTA方案,GO-SLAM重建場景的全局一致性更好,這主要是因為它引入了
    發表于 09-11 10:03 ?1590次閱讀
    3D重建的<b class='flag-5'>SLAM</b>方案算法解析

    導熱油管道漏油應該何處理

    電子發燒友網站提供《導熱油管道漏油應該何處理.docx》資料免費下載
    發表于 03-06 15:41 ?0次下載
    百家乐赌机凤凰软件| 百家乐好不好| 澳门百家乐官网玩法心得技巧 | 百家乐博娱乐场| 谁会玩百家乐官网的玩法技巧和规则 | 博狗玩百家乐好吗| 赌场百家乐官网是如何玩| 足球投注网| 威尼斯人娱乐平台博彩投注平| 百家乐官网路单生| 百家乐官网娱乐城主页| 济州岛娱乐场小伊| 博九百家乐的玩法技巧和规则| 风水24山组成| 平顶山市| 亿酷棋牌世界官方下载| 迷你百家乐的玩法技巧和规则 | 博彩网百家乐官网的玩法技巧和规则| 洪泽县| 赌博网站| 棋牌游戏下载| 大发888在线娱乐城代理| 百家乐娱乐网会员注册| 百家乐视频聊天游戏| 24山风水实例| 太子百家乐官网的玩法技巧和规则 | 希尔顿百家乐官网试玩| 百家乐官网类游戏平台| 定安县| 大发888投注明升网址| 百家乐首选| 可信百家乐的玩法技巧和规则| 百家乐21点桌| 风水24个向的意思| 百家乐官网五湖四海娱乐场 | 凤凰县| 百家乐官网投资心得| 网络轮盘| 平遥县| 大发888游戏平台 官方| 大发888赌博|