完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

一個用于6D姿態估計和跟蹤的統一基礎模型

0. 筆者個人體會

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose，是一個用于 6D 姿態估計和跟蹤的統一基礎模型。只要給出CAD模型或少量參考圖像，FoundationPose就可以在測試時立即應用于新物體，無需任何微調，關鍵是各項指標明顯優于專為每個任務設計的SOTA方案。

下面一起來閱讀一下這項工作，文末附論文和代碼鏈接~

1. 效果展示

FoundationPose實現了新物體的6D姿態估計和跟蹤，支持基于模型和無模型設置。在這四個任務中的每一個上，FoundationPose都優于專用任務的SOTA方案。(·表示僅RGB，×表示RGBD)。這里也推薦工坊推出的新課程《單目深度估計方法：算法梳理與代碼實現》。

2. 具體原理是什么？

為減少大規模訓練的人工工作，FoundationPose利用3D模型數據庫、大型語言模型和擴散模型等新技術，開發了一種新的合成數據生成Pipeline。為了彌補無模型和基于模型的設置之間的差距，FoundationPose利用以對象為中心的神經場來進行隨后的渲染和新視圖RGBD渲染。

對于姿態估計，首先在物體周圍均勻地初始化全局姿態，然后通過細化網絡對其進行細化。最后將改進的位姿轉發給姿態選擇模塊，預測位姿的分數，輸出得分最高的位姿。

3. 和其他SOTA方法對比如何？

YCB-Video數據集上Model-free方案的位姿估計定量結果對比。

YCB-Video數據集上位姿跟蹤的定量對比。這里也推薦工坊推出的新課程《單目深度估計方法：算法梳理與代碼實現》。

對更多實驗結果和文章細節感興趣的讀者，可以閱讀一下論文原文~

4. 論文信息

標題：FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者：Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

機構：NVIDIA

原文鏈接：https://arxiv.org/abs/2312.08344

代碼鏈接：https://github.com/NVlabs/FoundationPose

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5076

瀏覽量
103724
RGB

RGB

+關注

關注
4

文章
801

瀏覽量
58716

原文標題：通用性超強！同時實現6D位姿估計和跟蹤！

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關注！文章轉載請注明出處。

M1攜手6D Technologies云原生BSS平臺實現轉型

，M1 Limited的預付費和Maxx服務已成功遷移至尖端數字BSS平臺6D Technologies Canvas。在15個月的時間里，6D Technologies將M1的所有預付費和Maxx

發表于 01-15 15:42 ?117次閱讀

Todoist一鍵時間跟蹤

過三個簡單的步驟將您的Todoist工作區連接到TMetric時間跟蹤應用。通過單擊鼠標跟蹤執行任務所花費的時間。為項目獲取廣泛而精確的報告。添加計時器按鈕到Todoist任務中完成這三個

發表于 01-03 11:08 ?126次閱讀

KerasHub統一、全面的預訓練模型庫

深度學習領域正在迅速發展，在處理各種類型的任務中，預訓練模型變得越來越重要。Keras 以其用戶友好型 API 和對易用性的重視而聞名，始終處于這一動向的前沿。Keras 擁有專用的內容庫，如用于

發表于 12-20 10:32 ?169次閱讀

CNN, RNN, GNN和Transformer模型的統一表示和泛化誤差理論分析

背景介紹本文是基于我們之前的 RPN（Reconciled Polynomial Network）研究的后續工作。在此前的研究中，我們提出了 RPN 這一通用模型架構，其包含三個組件函數：數據擴展

發表于 12-06 11:31 ?480次閱讀

ov華米聯手打造OneLink統一鏈接平臺

小米應用商店近日攜手華為、OPPO、vivo等主流手機廠商，共同推出了一個名為OneLink的統一鏈接平臺。這一平臺旨在簡化開發者在應用分發和推廣過程中的工作流程，提供更為便捷和

發表于 11-18 15:01 ?418次閱讀

常見人體姿態評估顯示方式的兩種方式

，基于Deeplabv3+ 與ResNet34構建的一個人體語義分割模型。火柴人主要是基于關鍵點的人體姿態評估顯示方式，基于YOLOv8等人體姿態評估的關鍵點

發表于 11-11 11:21 ?281次閱讀

如何利用TPA2012D2的輸出端和阻抗值4OHM的喇叭建一個cadence仿真模型？

最近想用tlv320aic3106加tpa2012d2設計一個音頻設備，但是不太懂各個傳輸路徑上應該加什么樣的濾波電容，想請教一下如何利用TPA2012

發表于 11-07 07:42

為THS3001構建一個簡單的SPICE模型

電子發燒友網站提供《為THS3001構建一個簡單的SPICE模型.pdf》資料免費下載

發表于 10-29 10:11 ?1次下載

光學跟蹤測量系統如何工作的

、姿態等參數，實現對目標物體的精確跟蹤和測量。其工作原理主要包括以下幾個步驟：光源發射：光學跟蹤測量系統首先需要一個光源，

發表于 08-29 17:26 ?880次閱讀

統一多云管理平臺怎么用?

　統一多云管理平臺的使用主要涉及資源納管、費用控制和智能運維等方面。統一多云管理平臺是一種能夠同時管理多種公有云、私有云以及傳統IT環境的資源，并實現自動化和服務化交付的工具。它為企業提供了強大

發表于 08-14 11:28 ?272次閱讀

意法半導體新款MEMS IMU LSM6DSV32X實現精確姿態識別應用

憑借3核、6軸傳感架構，意法半導體新款MEMS IMU LSM6DSV32X能夠進行卓越的邊緣計算處理，是智能手機的高精度感測和3D地圖、筆記本電腦和平板電腦的情境感知、AR和VR的精確姿態

發表于 08-01 10:15 ?948次閱讀

在PyTorch中搭建一個最簡單的模型

在PyTorch中搭建一個最簡單的模型通常涉及幾個關鍵步驟：定義模型結構、加載數據、設置損失函數和優化器，以及進行模型訓練和評估。

發表于 07-16 18:09 ?2192次閱讀

使用CYW43439連接藍牙設備時，每次連接到一個通過掃描找到的bt mac地址時，都會返回 \"未找到設備\"，為什么？

Scanning ... F4:6D:3F:CF:96:F2 NMV483-ZB15G9 # bt-device -c F4:6D:3F:CF:96:F2 Connecting to：F4:6D:3F:CF:96:F2 錯誤：

發表于 05-31 06:15

包含具有多種類型信息的3D模型

Desktop是一個3D建模CAD程序，用于多種繪圖和設計，涵蓋建筑、土木和機械工程，以及室內設計、產品設計、景觀建筑甚至游戲開發。它通常用于

發表于 03-28 17:18

Franka Robotics推出“Franka AI Companion”助力機器人領域研究創新

Isaac Manipulator等軟件組件，使用NVIDIA Jetson Orin將GPU功率與實時機器人控制無縫集成，無需額外資源，并采用高精度 NVIDIA AI基礎模型用于6D姿態

發表于 03-20 22:01 ?458次閱讀

3D視覺工坊
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot ROS2概述和實踐入門
Hot 一文詳解卡爾曼濾波

New 全面總結動態NeRF
New 機器人沒有度量信息如何導航

精選推薦
更多

文章

資料

帖子

信創算力關鍵年的三個趨勢與最佳選擇

腦極體
6分鐘前

12 閱讀

康謀方案 | BEV感知技術：多相機數據采集與高精度時間同步方案

康謀自動駕駛
1小時前

76 閱讀

華為2024年營收超8600億！DeepSeek擴充朋友圈/英飛凌2025財年第一季度業績熱點科技新聞點評

章鷹觀察
3小時前

363 閱讀

如何使用MATLAB構建Transformer模型

MATLAB
4小時前

192 閱讀

線性穩壓器的另外一種用法

上海為昕科技有限公司
21小時前

210 閱讀

DZ000205 BGP協議原理

tutu27
5.60 MB

免費

0下載

角度傳感器簡單應用系統免費下載

o_dream
1.28 MB

免費

17下載

BFE Ingress Controller基于BFE實現的Kubernetes Ingress Controller

李永每
2.20 MB

2積分

2下載

DemonEditor Enigma2頻道和衛星列表編輯器

李鴻洋
0.76 MB

免費

0下載

EverCrypt跨平臺的現代加密庫

張麗
14.34 MB

免費

0下載

【ELF 2學習板試用】命令行功能測試-shell腳本進行IO控制-紅綠燈項目

lustao
14小時前

68 閱讀

迅為RK3568開發板篇OpenHarmony實操HDF驅動控制LED-編寫應用APP

jf_23361246
14小時前

65 閱讀

CS8M320燒錄不進

jf_71751014
14小時前

50 閱讀

【貝啟科技BQ3568HM開源鴻蒙開發板深度試用報告】3 - 智能家居中控屏連接華為云IoTDA物聯網平臺

zealsoft
14小時前

149 閱讀

【ELF 2學習板試用】ELF 2開發板的鏡像燒錄與網線連接配置

jf_97245988
1天前

206 閱讀

推薦專欄
更多

吴忠躺衫网络科技有限公司

搜索歷史

一個用于6D姿態估計和跟蹤的統一基礎模型

評論

M1攜手6D Technologies云原生BSS平臺實現轉型

Todoist一鍵時間跟蹤

KerasHub統一、全面的預訓練模型庫

CNN, RNN, GNN和Transformer模型的統一表示和泛化誤差理論分析

ov華米聯手打造OneLink統一鏈接平臺

常見人體姿態評估顯示方式的兩種方式

如何利用TPA2012D2的輸出端和阻抗值4OHM的喇叭建一個cadence仿真模型？

為THS3001構建一個簡單的SPICE模型

光學跟蹤測量系統如何工作的

統一多云管理平臺怎么用?

意法半導體新款MEMS IMU LSM6DSV32X實現精確姿態識別應用

在PyTorch中搭建一個最簡單的模型

使用CYW43439連接藍牙設備時，每次連接到一個通過掃描找到的bt mac地址時，都會返回 \"未找到設備\"，為什么？

包含具有多種類型信息的3D模型

Franka Robotics推出“Franka AI Companion”助力機器人領域研究創新