吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個用于6D姿態估計和跟蹤的統一基礎模型

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-12-19 09:58 ? 次閱讀

0. 筆者個人體會

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose,是一個用于 6D 姿態估計和跟蹤的統一基礎模型。只要給出CAD模型或少量參考圖像,FoundationPose就可以在測試時立即應用于新物體,無需任何微調,關鍵是各項指標明顯優于專為每個任務設計的SOTA方案。

下面一起來閱讀一下這項工作,文末附論文和代碼鏈接~

1. 效果展示

FoundationPose實現了新物體的6D姿態估計和跟蹤,支持基于模型和無模型設置。在這四個任務中的每一個上,FoundationPose都優于專用任務的SOTA方案。(·表示僅RGB,×表示RGBD)。這里也推薦工坊推出的新課程《單目深度估計方法:算法梳理與代碼實現》。

adfd5652-9dfa-11ee-8b88-92fbcf53809c.jpg

2. 具體原理是什么?

為減少大規模訓練的人工工作,FoundationPose利用3D模型數據庫、大型語言模型和擴散模型等新技術,開發了一種新的合成數據生成Pipeline。為了彌補無模型和基于模型的設置之間的差距,FoundationPose利用以對象為中心的神經場來進行隨后的渲染和新視圖RGBD渲染。

對于姿態估計,首先在物體周圍均勻地初始化全局姿態,然后通過細化網絡對其進行細化。最后將改進的位姿轉發給姿態選擇模塊,預測位姿的分數,輸出得分最高的位姿。

ae1028e0-9dfa-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法對比如何?

YCB-Video數據集上Model-free方案的位姿估計定量結果對比。

ae219558-9dfa-11ee-8b88-92fbcf53809c.jpg

YCB-Video數據集上位姿跟蹤的定量對比。這里也推薦工坊推出的新課程《單目深度估計方法:算法梳理與代碼實現》。

ae35a2aa-9dfa-11ee-8b88-92fbcf53809c.jpg

對更多實驗結果和文章細節感興趣的讀者,可以閱讀一下論文原文~

4. 論文信息

標題:FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者:Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

機構:NVIDIA

原文鏈接:https://arxiv.org/abs/2312.08344

代碼鏈接:https://github.com/NVlabs/FoundationPose








審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103724
  • RGB
    RGB
    +關注

    關注

    4

    文章

    801

    瀏覽量

    58716

原文標題:通用性超強!同時實現6D位姿估計和跟蹤!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    M1攜手6D Technologies云原生BSS平臺實現轉型

    ,M1 Limited的預付費和Maxx服務已成功遷移至尖端數字BSS平臺6D Technologies Canvas。 在15月的時間里,6D Technologies將M1的所有預付費和Maxx
    的頭像 發表于 01-15 15:42 ?117次閱讀

    Todoist鍵時間跟蹤

    過三簡單的步驟將您的Todoist工作區連接到TMetric時間跟蹤應用。通過單擊鼠標跟蹤執行任務所花費的時間。為項目獲取廣泛而精確的報告。 添加計時器按鈕到Todoist任務中 完成這三
    的頭像 發表于 01-03 11:08 ?126次閱讀
    Todoist<b class='flag-5'>一</b>鍵時間<b class='flag-5'>跟蹤</b>

    KerasHub統一、全面的預訓練模型

    深度學習領域正在迅速發展,在處理各種類型的任務中,預訓練模型變得越來越重要。Keras 以其用戶友好型 API 和對易用性的重視而聞名,始終處于這動向的前沿。Keras 擁有專用的內容庫,如用于
    的頭像 發表于 12-20 10:32 ?169次閱讀

    CNN, RNN, GNN和Transformer模型統一表示和泛化誤差理論分析

    背景介紹 本文是基于我們之前的 RPN(Reconciled Polynomial Network)研究的后續工作。在此前的研究中,我們提出了 RPN 這通用模型架構,其包含三組件函數:數據擴展
    的頭像 發表于 12-06 11:31 ?480次閱讀
    CNN, RNN, GNN和Transformer<b class='flag-5'>模型</b>的<b class='flag-5'>統一</b>表示和泛化誤差理論分析

    ov華米聯手打造OneLink統一鏈接平臺

    小米應用商店近日攜手華為、OPPO、vivo等主流手機廠商,共同推出了名為OneLink的統一鏈接平臺。這平臺旨在簡化開發者在應用分發和推廣過程中的工作流程,提供更為便捷和
    的頭像 發表于 11-18 15:01 ?418次閱讀

    常見人體姿態評估顯示方式的兩種方式

    ,基于Deeplabv3+ 與ResNet34構建的一個人體語義分割模型。 火柴人 主要是基于關鍵點的人體姿態評估顯示方式,基于YOLOv8等人體姿態評估的關鍵點
    的頭像 發表于 11-11 11:21 ?281次閱讀
    常見人體<b class='flag-5'>姿態</b>評估顯示方式的兩種方式

    如何利用TPA2012D2的輸出端和阻抗值4OHM的喇叭建cadence仿真模型

    最近想用tlv320aic3106加tpa2012d2設計音頻設備,但是不太懂各個傳輸路徑上應該加什么樣的濾波電容,想請教下如何利用TPA2012
    發表于 11-07 07:42

    為THS3001構建簡單的SPICE模型

    電子發燒友網站提供《為THS3001構建簡單的SPICE模型.pdf》資料免費下載
    發表于 10-29 10:11 ?1次下載
    為THS3001構建<b class='flag-5'>一</b><b class='flag-5'>個</b>簡單的SPICE<b class='flag-5'>模型</b>

    光學跟蹤測量系統如何工作的

    姿態等參數,實現對目標物體的精確跟蹤和測量。其工作原理主要包括以下幾個步驟: 光源發射:光學跟蹤測量系統首先需要光源,
    的頭像 發表于 08-29 17:26 ?880次閱讀

    統一多云管理平臺怎么用?

     統一多云管理平臺的使用主要涉及資源納管、費用控制和智能運維等方面。統一多云管理平臺是種能夠同時管理多種公有云、私有云以及傳統IT環境的資源,并實現自動化和服務化交付的工具。它為企業提供了強大
    的頭像 發表于 08-14 11:28 ?272次閱讀

    意法半導體新款MEMS IMU LSM6DSV32X實現精確姿態識別應用

    憑借3核、6軸傳感架構,意法半導體新款MEMS IMU LSM6DSV32X能夠進行卓越的邊緣計算處理,是智能手機的高精度感測和3D地圖、筆記本電腦和平板電腦的情境感知、AR和VR的精確姿態
    的頭像 發表于 08-01 10:15 ?948次閱讀

    在PyTorch中搭建最簡單的模型

    在PyTorch中搭建最簡單的模型通常涉及幾個關鍵步驟:定義模型結構、加載數據、設置損失函數和優化器,以及進行模型訓練和評估。
    的頭像 發表于 07-16 18:09 ?2192次閱讀

    使用CYW43439連接藍牙設備時,每次連接到通過掃描找到的bt mac地址時,都會返回 \"未找到設備\",為什么?

    Scanning ... F4:6D:3F:CF:96:F2 NMV483-ZB15G9 # bt-device -c F4:6D:3F:CF:96:F2 Connecting to:F4:6D:3F:CF:96:F2 錯誤:
    發表于 05-31 06:15

    包含具有多種類型信息的3D模型

    Desktop是3D建模CAD程序,用于多種繪圖和設計,涵蓋建筑、土木和機械工程,以及室內設計、產品設計、景觀建筑甚至游戲開發。它通常用于
    發表于 03-28 17:18

    Franka Robotics推出“Franka AI Companion”助力機器人領域研究創新

    Isaac Manipulator等軟件組件,使用NVIDIA Jetson Orin將GPU功率與實時機器人控制無縫集成,無需額外資源,并采用高精度 NVIDIA AI基礎模型用于6D姿態
    的頭像 發表于 03-20 22:01 ?458次閱讀
    Franka Robotics推出“Franka AI Companion”助力機器人領域研究創新
    章丘市| 明珠百家乐官网的玩法技巧和规则 | 波音网百家乐合作| 大世界百家乐官网娱乐网| 金榜百家乐官网现金网| 六合彩网站| 大发888游戏平台dafa 888 gw| 百家乐游戏免费下| 广东百家乐主论坛| 澳门百家乐庄闲和| 百家乐澳门百家乐| 24山先天分房| 百家乐官网赢退输进有哪些| 足球百家乐官网投注| 百家乐官网博彩策略论坛| 百家乐官网巴厘岛平台| 百家乐官网真人游戏网| 博九网百家乐官网现金网| 体育投注| 百家乐官网注码管理| 百家乐官网知敌便能制胜| 百家乐官网赢钱好公式| 百家乐官网百姓话题| 百家乐官网佛泰阁| 百家乐官网赌博彩| 百家乐官网斗地主炸金花| 澳门百家乐官网路单| 迪威百家乐现场| 百家乐翻天粤语qvod| 百家乐玩揽法大全| 百家乐缩水工具| 德州扑克入门| 富贵乐园棋牌游戏| 捞金博彩论坛| 电子百家乐官网博彩正网| 百家乐官网学院| 澳门百家乐官网单注下| 网上百家乐心得| 百家乐赌场牌路分析| 皇家百家乐的玩法技巧和规则 | 百家乐长龙技巧|