據外媒報道,現在有一種全新的成像方法可以利用人工智能(AI)將時間轉換為3D空間視覺,以幫助汽車、移動設備和健康檢測器研發360度感知能力。照片和視頻通常都通過利用數字傳感器捕捉光子(光的組成部分)制作而成,例如,數碼相機由數百萬個像素組成,通過探測空間中每一個點的光的強度和顏色來形成圖像。然后,通過在被拍攝的對象周圍放置兩個或多個相機,對其進行多角度拍攝,或者利用光子流掃描場景并在3D空間中進行重建,就可以生成3D圖像。無論采用上述何種方式,就是通過收集場景中的空間信息來構建圖像。
據外媒報道,最近,英國格拉斯哥大學(University of Glasgow)與意大利米蘭理工大學(Polytechnic University of Milan)和荷蘭代爾夫特理工大學(Delft University of Technology)的研究人員描述了一種制作3D動畫的全新方法,即通過捕獲光子的時間信息,而不是空間坐標來進行制作。
首先,研究人員們采用一種簡單、廉價的單點探測器,將其調整為光子的秒表。與測量空間中光的顏色和強度分布的相機不同,該探測器只記錄由瞬間激光脈沖產生的光子從既定場景中的每個物體上反射到傳感器所需的時間。物體越遠,每個光子反射到傳感器所需的時間就越長。每個光子在場景中反射的時間信息稱為時間數據,被研究人員收集在一個非常簡單的圖表中。
然后,在復雜神經網絡算法的幫助下,此類圖表被轉換成3D圖像。研究人員對該算法進行了訓練,向其展示了數千張普遍照片(包含團隊在實驗室周圍移動和搬運物體的內容)以及由單點探測器同時捕獲的時間數據。
最終,該神經網絡充分了解到時間數據如何與照片相對應,從而能夠僅利用時間數據創建高度精確的圖像。在原理驗證實驗中,盡管硬件和算法可能每秒會產生成千上萬張圖像,該團隊還是成功以大約每秒10幀的速度利用時間數據構造出動態圖像。
目前,該神經網絡創建圖像的能力受限于所經受的訓練,此類訓練讓其可以從研究人員所創建的場景的時間數據中進行挑選。不過,通過進一步訓練,甚至采用更高級的算法,該神經網絡可以學會將各種各樣的場景進行可視化,并擴大應用于現實環境中。
研究人員表示:“收集時間數據的單點探測器體積小、重量輕、價格便宜,因而很容易被加入到自動駕駛汽車攝像頭等現有系統中,以提高汽車尋路的準確性和速度。此外,還可以增強谷歌Pixel 4等移動設備上現有的傳感器,因為Pixel 4已經配備了一個基于雷達技術的簡單手勢識別系統。此外,我們的新技術甚至可用于監測醫院病人胸部的升降情況,以提醒醫護人員觀察病人的呼吸變化,或者跟蹤病人的行動,確保其安全。我們的下一步是研發一種獨立的便攜式盒裝系統,并希望能夠與商業伙伴一起研究?!?br /> 責任編輯:tzh
-
3D
+關注
關注
9文章
2912瀏覽量
108009 -
神經網絡
+關注
關注
42文章
4781瀏覽量
101177 -
AI
+關注
關注
87文章
31536瀏覽量
270348 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240307
發布評論請先 登錄
相關推薦
評論