近日,美國普渡大學(xué)機械工程系教授,OSA、SPIE Fellow張松作客奧比中光,為研發(fā)人員帶來《High-resolution, high-speed 3D Imaging andapplications》的主題講座,分享其在高速、高分辨率3D成像和光學(xué)信息處理方面的研發(fā)成果。
談AI 3D感知技術(shù)
“3D感知是一個非常核心的前端技術(shù)”
O(奧比君):您認(rèn)為3D感知技術(shù)在人工智能領(lǐng)域扮演著何種角色?
Z(張松):3D感知是一個非常核心的前端技術(shù)。人工智能技術(shù)如機器學(xué)習(xí)等,必須要有一個好的傳感器,就像人類學(xué)習(xí)必須通過眼睛一樣,如果沒有眼睛,我們的學(xué)習(xí)就會很困難。現(xiàn)在的人工智能主要基于二維圖像或視頻,但世界是三維的,未來技術(shù)方向也一定是三維的,這點我沒有任何懷疑。
3D感知技術(shù)之所以沒有大規(guī)模應(yīng)用,主要是因為3D傳感器還未大規(guī)模普及。比如一些手機搭載有3D攝像頭,但拍攝的三維數(shù)據(jù)十分基礎(chǔ),也很費存儲空間,用戶無法直接獲取和使用三維數(shù)據(jù),它并不能像平面圖片一樣可以直接使用。3D傳感器的缺失使得3D AI應(yīng)用也未大規(guī)模普及。
第二個是因為好的3D傳感器、尤其是精度高的傳感器很貴。這也是一個障礙,如果高精度3D傳感器像2D傳感器一樣便宜、好用,之后做人工智能后端研發(fā)應(yīng)用就比較容易了。
談5G與3D感知融合
“5G與3D感知結(jié)合后,最先在通訊領(lǐng)域爆發(fā)”
O:未來隨著3D傳感器普及,您看好3D感知技術(shù)在哪些領(lǐng)域的應(yīng)用前景?
Z:我個人關(guān)注的比較多的,像消費電子類的,奧比中光已經(jīng)在做了。
另一個是人機交互。我認(rèn)為未來在工廠生產(chǎn)線或其它領(lǐng)域,3D感知會讓人與機器的交互越來越智能。比如,大型器件的裝配可使用3D感知技術(shù),屆時人與機器人的交互會更加協(xié)調(diào)。
機器人也是一個很大的領(lǐng)域,比如伺服機器人、工業(yè)機器人等。像前幾天發(fā)生地震,房屋倒塌了,送機器人進(jìn)去肯定更好、更安全。3D傳感器可以幫助機器人去探索一些未知的東西,這個時候機器人可以發(fā)揮它的極限。
另外在醫(yī)療方面也會發(fā)揮非常大的作用。3D傳感器可以把醫(yī)療問題變得簡單,比如一些簡單的自查步驟,利用3D感知技術(shù)就能自主完成。未來機器人做疑難手術(shù)時,也可以用3D感知技術(shù),病人和醫(yī)生可以在不同的地方實時交流,甚至跨時區(qū)共同完成一臺手術(shù)。
O:就像電影中展現(xiàn)的全息投影技術(shù)?
Z:并不一定是投影。比如我身上有傷口,通過電話、視頻,我是沒法精確的描述傷口有多深、多嚴(yán)重。但如果有3D傳感器的話,就可以精確地測量傷口了。測量完后,就可以直接找護(hù)士處理,醫(yī)生的時間可以用來處理更重要的事。
O:您認(rèn)為國內(nèi)外在3D感知的商用落地上,有著怎樣的不同?
Z:3D感知落地方面,國外跟中國差距比較大。中國落地商用很快,第一是有資金,另外有一批很聰明很努力的人在推動,這樣落地會非常快。但在國外,一個新項目的論證會反反復(fù)復(fù),有時候甚至?xí)匣ㄒ粌赡陼r間才能完成論證,落地自然慢很多。中國擁有資金和巨大的市場,落地就會快。
O:在5G時代,您認(rèn)為3D感知技術(shù)與5G結(jié)合將有怎樣的前景?
Z:5G網(wǎng)絡(luò)帶寬放大了,我們就可以做一些之前做不了的事情,比如可以拍攝高精度三維影像,再利用5G實時傳到其它終端。
舉個例子,一個零部件是在深圳加工的,另一個零部件可能是在成都加工的,如何知道兩個零件能否組裝到一起?3D感知結(jié)合5G之后,這件事就會變得容易。深圳加工完后,利用5G把零部件的三維影像發(fā)送到成都,兩邊可實時查看兩個零部件的裝配效果。未來,遠(yuǎn)程的合作將變得非常簡單。
O:大家都很好奇,5G與3D感知結(jié)合后,哪個領(lǐng)域會最先爆發(fā)?
Z:5G與3D感知結(jié)合后,肯定最先在通訊領(lǐng)域爆發(fā)。現(xiàn)在每個人都很忙,見自己父母、孩子的機會和時間都比較有限,聯(lián)系親人的時候,我們一般會打視頻電話,但仍然覺得不夠真實。以后能否實現(xiàn)更真實、更自然的交互?我認(rèn)為沒有5G的話會很難,但如果網(wǎng)絡(luò)速度足夠快的話,就很有可能實現(xiàn)了。
O:想起您在普渡大學(xué)做的3D實時視頻。
Z:對,我做3D實時視頻已經(jīng)做了十年了。現(xiàn)在的進(jìn)展是可以把實時三維人像傳到每個人的手機上。視頻通話的時候,你可以(把畫面)轉(zhuǎn)一轉(zhuǎn)、看到實時的三維人像。
當(dāng)下人與人之間的距離肯定是越來越近、交流越來越自然越好,所以我們肯定需要3D實時視頻技術(shù)。就像手機,發(fā)展到后來肯定是越來越容易、自然,人與人的交互也是一樣。早期只能打電話,很有距離感,有視頻后距離近了一些,如果有3D視頻的話,這個距離就更近了。
談青年研究
“要做到第一,基本功一定要打牢”
O:您一直在3D感知研究一線深耕學(xué)術(shù),過去也發(fā)表了多篇論文、獲得了眾多獎項,您認(rèn)為做3D感知研究,什么品質(zhì)最重要?
Z:科研就是要堅持,不要怕失敗。我失敗的例子很多,比如我讀了三年博士,第三年結(jié)束的時候,還沒出什么成果。那時候我很困擾,不知道該往哪個方向走。然后我給美國一個3D感知領(lǐng)域知名教授寫了一封郵件,問他我該往哪個方向去走。他給我回了郵件,建議我放棄。但我性格比較鉆牛角尖,決定堅持。一年后的2004年,我就做出來了第一個3D實時視頻系統(tǒng)。
就我個人而言,運氣是一方面,另外一方面是堅持去做。做了很多年以后把東西做出來了,這個東西很有用,會很有成就感。當(dāng)然,之前的挫折沒有多少人能真正理解。
O:要堅持,要專注。
Z:對,不管是在學(xué)術(shù)界還是工業(yè)界都是一樣的,你只有走到別人前面,才有可能引領(lǐng)這個領(lǐng)域。人們一般只會記住第一名,而不是第二名。要做到第一,基本功一定要打牢,尤其在學(xué)校里面,或出去工作之前。
我的背景是機械系,我覺得我計算機的背景不夠,就去上計算機系的課。后來發(fā)現(xiàn)我硬件背景不夠,又跑到電子系去上課。我之所以能做比較原創(chuàng)性的東西,并不用我熟悉領(lǐng)域的方法去解決,而是利用其他領(lǐng)域的工具,比如我用機械的思路解決不了,換一個思路,用計算機的方法就解決出來了。所以如果基本功不扎實的話,創(chuàng)新性技術(shù)是很難做出來的。
O:您覺得哪些基本功最重要?
Z:數(shù)學(xué)、物理、計算機、電子硬件,甚至包括一些機械設(shè)計。3D感知其實是一個非常交叉的領(lǐng)域。
談奧比中光印象
“成長速度遠(yuǎn)遠(yuǎn)超出我的想象”
O:談?wù)勀鷮W比中光的印象?
Z:奧比中光的成長速度遠(yuǎn)遠(yuǎn)超出我的想象。我一直認(rèn)為,好的技術(shù)不一定能夠做成好的產(chǎn)品,但奧比中光的技術(shù)和產(chǎn)品都做得非常成功。
只是快還不夠,還必須要做得足夠好。產(chǎn)品質(zhì)量好了,給了客戶很好的體驗,得到客戶的好評,客戶才會繼續(xù)用,這樣公司才能夠持續(xù)發(fā)展壯大。奧比中光能夠做大做強,產(chǎn)品做得好是主要的原因。
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270353 -
3D成像
+關(guān)注
關(guān)注
0文章
98瀏覽量
16153
原文標(biāo)題:光圈 | 3D感知將在什么領(lǐng)域最快爆發(fā)?這位OSA、SPIE Fellow這樣說
文章出處:【微信號:orbbec,微信公眾號:奧比中光】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論