明陞娱乐场官网百家乐赌博,真人真钱打麻将,赌球信誉平台开户(中国)·官方网站

僅僅通過在照片上訓(xùn)練模型，機(jī)器學(xué)習(xí)（ML）的最新技術(shù)就已經(jīng)在許多計(jì)算機(jī)視覺任務(wù)中取得了卓越的準(zhǔn)確性。在這些成功的基礎(chǔ)上，進(jìn)一步提高對(duì)3D對(duì)象的理解，這將極大地促進(jìn)更廣泛的應(yīng)用，例如增強(qiáng)現(xiàn)實(shí)，機(jī)器人技術(shù)，自主性和圖像檢索。

今年早些時(shí)候，我們發(fā)布了MediaPipe Objectron，這是一套針對(duì)移動(dòng)設(shè)備設(shè)計(jì)的實(shí)時(shí)3D對(duì)象檢測(cè)模型，這些模型在經(jīng)過完全注釋（annotated）的真實(shí)3D數(shù)據(jù)集上進(jìn)行了訓(xùn)練，可以預(yù)測(cè)對(duì)象的3D邊界框。

然而，由于與2D任務(wù)（例如ImageNet，COCO和Open Images）相比，因?yàn)槿鄙俅笮驼鎸?shí)數(shù)據(jù)集，所以了解3D對(duì)象仍然是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。為了使研究社區(qū)能夠不斷提高三維實(shí)體的理解，迫切需要發(fā)布以對(duì)象為中心的視頻數(shù)據(jù)集，該數(shù)據(jù)集可以捕獲對(duì)象的更多3D結(jié)構(gòu)，同時(shí)匹配用于許多視覺任務(wù)的數(shù)據(jù)格式（例如視頻或攝像機(jī)流），以幫助訓(xùn)練和確定機(jī)器學(xué)習(xí)模型的基準(zhǔn)。

今天，我們很高興發(fā)布Objectron數(shù)據(jù)集，這是一個(gè)短的，以對(duì)象為中心的視頻剪輯的集合，可以從不同的角度捕獲更大的一組公共對(duì)象。每個(gè)視頻剪輯都隨附有AR會(huì)話元數(shù)據(jù)，其中包括相機(jī)姿勢(shì)和稀疏點(diǎn)云。除此之外，數(shù)據(jù)還包含每個(gè)對(duì)象手工標(biāo)注的3D邊框，用來描述對(duì)象的位置，方向和尺寸。數(shù)據(jù)集包括15K帶注釋的視頻剪輯，并補(bǔ)充了從不同地理區(qū)域的樣本中收集的超過4M帶注釋的圖像（覆蓋五大洲的10個(gè)國(guó)家/地區(qū)）。

三維實(shí)體檢測(cè)解決方案

除了和數(shù)據(jù)集一起之外，我們還將共享一個(gè)針對(duì)四類對(duì)象的三維實(shí)體檢測(cè)解決方案-鞋子，椅子，杯子和照相機(jī)。這些模型在MediaPipe中發(fā)布，MediaPipe是Google的跨平臺(tái)可定制ML解決方案的開源框架，適用于實(shí)時(shí)和流媒體，該解決方案還支持設(shè)備上的實(shí)時(shí)手部，虹膜和身體姿勢(shì)跟蹤等ML解決方案。

在移動(dòng)設(shè)備上運(yùn)行的3D對(duì)象檢測(cè)解決方案的示例結(jié)果

與以前發(fā)布的單階段Objectron模型相反，這些最新版本使用兩級(jí)架構(gòu)。第一階段采用TensorFlow對(duì)象檢測(cè)模型來查找實(shí)體的2D裁剪。然后，第二階段使用圖像裁剪來估計(jì)3D邊框，同時(shí)為下一幀計(jì)算實(shí)體的2D裁剪，因此實(shí)體檢測(cè)器不需要運(yùn)行每個(gè)幀。第二階段3D邊框預(yù)測(cè)器在Adreno 650移動(dòng)GPU上以83 FPS運(yùn)行。

參考3D對(duì)象檢測(cè)解決方案圖

3D對(duì)象檢測(cè)的評(píng)估指標(biāo)

借助ground truth annotations，我們使用3Dinte rsection over union（IoU）相似度統(tǒng)計(jì)信息（一種用于計(jì)算機(jī)視覺任務(wù)的常用度量標(biāo)準(zhǔn)）來評(píng)估三維實(shí)體檢測(cè)模型的性能，該度量標(biāo)準(zhǔn)衡量邊框與地面真相的接近程度。

我們提出了一種算法，可為通用三維面向盒計(jì)算準(zhǔn)確的3D IoU值。首先，我們使用Sutherland-Hodgman多邊形裁剪算法計(jì)算兩個(gè)盒子的面之間的交點(diǎn)。這類似于用于計(jì)算機(jī)圖形學(xué)的視錐剔除技術(shù)。相交的體積由所有修剪的多邊形的凸包計(jì)算。最后，根據(jù)兩個(gè)框的交點(diǎn)的體積和并集的體積計(jì)算IoU。我們將在發(fā)表數(shù)據(jù)集的同時(shí)發(fā)布評(píng)估指標(biāo)的源代碼。

使用多邊形裁剪算法計(jì)算并集的三維交點(diǎn)(左):通過對(duì)方框裁剪多邊形計(jì)算每個(gè)面的交點(diǎn)。右:通過計(jì)算所有交點(diǎn)的凸包計(jì)算交點(diǎn)的體積(綠色)。

數(shù)據(jù)集格式

數(shù)據(jù)集的技術(shù)細(xì)節(jié)，包括用法和教程，可在數(shù)據(jù)集網(wǎng)站上找到。數(shù)據(jù)集包括自行車，書籍，瓶子，照相機(jī)，谷物盒，椅子，杯子，筆記本電腦和鞋子，并存儲(chǔ)在Google Cloud存儲(chǔ)上的objectron存儲(chǔ)桶中，具有以下資源：

視頻片段

注釋標(biāo)簽（實(shí)體的3D邊框）

AR元數(shù)據(jù)（例如照相機(jī)姿勢(shì)，點(diǎn)云和平面）

已處理的數(shù)據(jù)集：帶注釋幀的改編版本，圖像的格式為tf.example，視頻的格式為SequenceExample。

支持腳本以基于上述指標(biāo)運(yùn)行評(píng)估

支持腳本以將數(shù)據(jù)加載到Tensorflow，PyTorch和Jax中并可視化數(shù)據(jù)集，包括“ Hello World”示例

有了數(shù)據(jù)集，我們還將開放數(shù)據(jù)管道，以在流行的Tensorflow，PyTorch和Jax框架中解析數(shù)據(jù)集。還提供了示例colab筆記本。

通過發(fā)布此Objectron數(shù)據(jù)集，我們希望使研究界能夠突破三維實(shí)體幾何理解的極限。我們還希望促進(jìn)新的研究和應(yīng)用。例如視圖合成，改進(jìn)的三維表達(dá)和無監(jiān)督學(xué)習(xí)。加入我們的郵件列表并訪問我們的github頁面，請(qǐng)隨時(shí)關(guān)注未來的活動(dòng)和發(fā)展。

致謝

這篇文章中描述的研究是由Adel Ahmadyan, Liangkai Zhang, JianingWei, Artsiom Ablavatski, Mogan Shieh, Ryan Hickman, Buck Bourdon, Alexander Kanaukou, Chuo-Ling Chang, Matthias Grundmann, ?and Tom Funkhouser完成的。我們感謝Aliaksandr Shyrokau，Sviatlana Mialik，Anna Eliseeva和注釋團(tuán)隊(duì)的高質(zhì)量注釋。我們還要感謝Jonathan Huang和Vivek Rathod對(duì)TensorFlow對(duì)象檢測(cè)API的指導(dǎo)。

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

檢測(cè)器

檢測(cè)器

+關(guān)注

關(guān)注
1

文章
869

瀏覽量
47787
Google

Google

+關(guān)注

關(guān)注
5

文章
1772

瀏覽量
57807
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1209

瀏覽量
24835

原文標(biāo)題：Google發(fā)布Objectron數(shù)據(jù)集

文章出處：【微信號(hào)：livevideostack，微信公眾號(hào)：LiveVideoStack】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

三維掃描與建模的區(qū)別三維掃描在工業(yè)中的應(yīng)用

數(shù)據(jù)。這一過程是自動(dòng)化的，能夠快速捕捉物體的三維信息。三維建模：則需要專業(yè)建模師使用三維建模軟件，從無到有地創(chuàng)建三維模型。建模師可以根據(jù)不同的需求調(diào)整建模

發(fā)表于 12-19 14:55 ?324次閱讀

南方智能推出三維地理實(shí)體生產(chǎn)軟件

新型基礎(chǔ)測(cè)繪與實(shí)景三維中國(guó)建設(shè)持續(xù)推進(jìn)，南方智能深度聚焦，基于自主研發(fā)的SmartGIS平臺(tái)，打造以地理實(shí)體數(shù)據(jù)為核心的“生產(chǎn)、處理、質(zhì)檢、管理、可視化分析”實(shí)景三維系列軟件，提供全流程、按需定制的服務(wù)

發(fā)表于 11-06 10:26 ?319次閱讀

三維打印技術(shù)原理

三維打印技術(shù)，又稱3D打印技術(shù)，是一種快速成型技術(shù)，其核心原理在于將數(shù)字模型文件逐層轉(zhuǎn)化為實(shí)體物體。以下是三維打印技術(shù)原理的詳細(xì)闡述：

發(fā)表于 09-16 15:31 ?947次閱讀

蔡司掃描儀GOM Scan 1三維掃描儀對(duì)考古文物建模掃描

在考古環(huán)境中，三維掃描技術(shù)應(yīng)用廣泛，如存檔、保存、復(fù)制和分享（包括實(shí)體和虛擬形式）。文中，通過真實(shí)的掃描案例，您將了解到三維光學(xué)解決方案如何幫助呈現(xiàn)精確細(xì)節(jié)、顯示文物顏色和紋理的掃描網(wǎng)

發(fā)表于 09-04 10:51 ?613次閱讀

蔡司掃描儀GOM Scan 1<b class='flag-5'>三維</b>掃描儀對(duì)考古文物建模掃描

友思特方案基于三維點(diǎn)云實(shí)現(xiàn)PCB裝配螺絲視覺檢測(cè)

三維點(diǎn)云是完成精密化 PCB 檢測(cè)的最新視覺技術(shù)。友思特 Saccde Vision 視覺掃描系統(tǒng)，采用先進(jìn)的三維成像技術(shù)和算法輸出直觀點(diǎn)云圖，進(jìn)一步確保了PCB生產(chǎn)的可靠性與穩(wěn)定性能。

發(fā)表于 08-28 16:35 ?351次閱讀

友思特<b class='flag-5'>方案</b> 基于<b class='flag-5'>三維</b>點(diǎn)云實(shí)現(xiàn)PCB裝配螺絲視覺<b class='flag-5'>檢測(cè)</b>

校園三維可視化解決方案

在當(dāng)今數(shù)字化時(shí)代，校園管理面臨著越來越復(fù)雜的挑戰(zhàn)和需求。為了更好地實(shí)現(xiàn)校園資源管理、安全監(jiān)控、規(guī)劃設(shè)計(jì)等多方面的需求，校園三維可視化 解決方案應(yīng)運(yùn)而生。通過將校園環(huán)境、設(shè)施、資源等信息進(jìn)行

發(fā)表于 08-16 14:05 ?227次閱讀

數(shù)字孿生三維可視化平臺(tái)

數(shù)字孿生三維可視化平臺(tái)作為當(dāng)今智能化解決方案的前沿工具，奠定了數(shù)字孿生技術(shù)與三維可視化技術(shù)在各行業(yè)中的重要地位。數(shù)字孿生技術(shù)通過數(shù)學(xué)建模、仿真計(jì)算和數(shù)據(jù)分析實(shí)現(xiàn)對(duì)實(shí)體系統(tǒng)的虛擬復(fù)制，

發(fā)表于 06-28 17:15 ?576次閱讀

泰來三維|三維激光掃描技術(shù)在古建筑保護(hù)中的應(yīng)用

通過三維激光掃描技術(shù)，可以快速獲取古建筑的精確三維模型。在文物保護(hù)與修復(fù)過程中，利用三維模型可以更加全面、準(zhǔn)確地記錄古建筑的損傷情況，并輔助修復(fù)工作的設(shè)計(jì)和實(shí)施。例如，通過對(duì)模型進(jìn)行測(cè)量和分析，修復(fù)人員可以預(yù)測(cè)古建筑的穩(wěn)定性，制

發(fā)表于 06-21 09:15 ?646次閱讀

泰來<b class='flag-5'>三維</b>|<b class='flag-5'>三維</b>激光掃描技術(shù)在古建筑保護(hù)中的應(yīng)用

車架三維掃描逆向建模大尺寸部件stl建模曲面逆向設(shè)計(jì)方案

三維掃描技術(shù)在汽車設(shè)計(jì)、制造、質(zhì)量檢測(cè)等多個(gè)環(huán)節(jié)中都發(fā)揮著關(guān)鍵作用。汽車車架三維掃描建模是汽車工程領(lǐng)域中的一項(xiàng)重要技術(shù)，通過CASAIM高精度的三維掃描設(shè)備，對(duì)車架表面進(jìn)行快速掃描，獲

發(fā)表于 06-11 16:57 ?508次閱讀

車架<b class='flag-5'>三維</b>掃描逆向建模大尺寸部件stl建模曲面逆向設(shè)計(jì)<b class='flag-5'>方案</b>

泰來三維|數(shù)字化工廠_煤礦三維掃描數(shù)字化解決方案

采用大空間三維激光掃描儀對(duì)廠區(qū)內(nèi)部進(jìn)行架站式精準(zhǔn)三維掃描。廠區(qū)外部采用無人機(jī)傾斜攝影的方式獲取彩色模型數(shù)據(jù),采集控制點(diǎn)坐標(biāo)與三維點(diǎn)云進(jìn)行坐標(biāo)轉(zhuǎn)換融合點(diǎn)云數(shù)據(jù),快速得到廠區(qū)內(nèi)外完整的三維

發(fā)表于 05-29 11:55 ?500次閱讀

三維雷達(dá)在煤礦安全檢測(cè)中如何應(yīng)用

三維雷達(dá)在煤礦安全檢測(cè)中的應(yīng)用主要體現(xiàn)在以下幾個(gè)方面：井下環(huán)境探測(cè)：三維雷達(dá)技術(shù)能夠掃描煤礦井下環(huán)境，生成高精度的三維點(diǎn)云數(shù)據(jù)，從而構(gòu)建出井下的

發(fā)表于 05-22 10:08 ?495次閱讀

三維雷達(dá)在煤堆檢測(cè)中的具體應(yīng)用和優(yōu)勢(shì)

三維雷達(dá)在煤堆檢測(cè)中具有顯著的優(yōu)勢(shì)和應(yīng)用價(jià)值。以下是三維雷達(dá)在煤堆檢測(cè)中的具體應(yīng)用和優(yōu)勢(shì)：原理介紹：三維雷達(dá)通過發(fā)射高頻電磁波，這些電磁

發(fā)表于 05-22 10:05 ?408次閱讀

泰來三維|三維掃描服務(wù)_三維掃描助力園區(qū)改造公園

三維激光掃描儀利用激光反射測(cè)距原理，通過接受和返回的信號(hào)，獲取點(diǎn)云三維空間坐標(biāo)。這種測(cè)量方式可以無接觸快速獲取大型建筑三維空間數(shù)據(jù)，實(shí)現(xiàn)實(shí)體建筑的高精度數(shù)字化。根據(jù)

發(fā)表于 05-07 11:44 ?313次閱讀

三維掃描服務(wù)項(xiàng)目-工廠三維掃描建模

工廠三維掃描,廠房三維掃描,工廠數(shù)字化服務(wù),工廠三維掃描解決方案,逆向還原石化管線，完成工廠數(shù)據(jù)化,為工廠設(shè)施的設(shè)計(jì)改造和維修維護(hù)提供原始三維

發(fā)表于 04-26 09:46 ?616次閱讀

泰來三維|文物三維掃描，文物三維模型怎樣制作

文物三維掃描，文物三維模型怎樣制作：我們都知道文物是不可再生的，要繼續(xù)保存?zhèn)鞒?，需要文?b class='flag-5'>三維數(shù)字化保護(hù)，所以三維數(shù)字化文物保護(hù)是非常重要的一個(gè)技術(shù)手段。那么文物

發(fā)表于 03-12 11:10 ?734次閱讀