如今有一種觀點(diǎn)認(rèn)為,GPU并非為深度學(xué)習(xí)而生,只是恰好并行計(jì)算滿(mǎn)足大數(shù)據(jù)處理需求而已。那么,GPU會(huì)在深度學(xué)習(xí)領(lǐng)域失寵嗎?NVIDIA全球副總裁、中國(guó)區(qū)總經(jīng)理張建中在AI WORLD 2018世界人工智能峰會(huì)分享以《AI與自動(dòng)駕駛》為主題的演講時(shí)表示:GPU是做AI和深度學(xué)習(xí)最好的架構(gòu),它已不再只是單純的圖像處理器。張建中認(rèn)為,在很多場(chǎng)景下,AI應(yīng)用需要高精確度的推理平臺(tái),尤其是在自動(dòng)駕駛場(chǎng)景下。
近年來(lái),深度學(xué)習(xí)在很多行業(yè)得以廣泛應(yīng)用,這很大程度上得益于神經(jīng)網(wǎng)絡(luò)和硬件的飛速發(fā)展。
如今存在著這樣一種論調(diào):GPU并非為深度學(xué)習(xí)而生,只是恰好并行計(jì)算滿(mǎn)足大數(shù)據(jù)處理需求而已。那么,GPU會(huì)在深度學(xué)習(xí)領(lǐng)域失寵嗎?
9月20日,NVIDIA全球副總裁、中國(guó)區(qū)總經(jīng)理張建中在AI WORLD 2018世界人工智能峰會(huì)上談到了這一問(wèn)題,他表示:GPU是做AI和深度學(xué)習(xí)最好的架構(gòu)。從摩爾定律到AI摩爾定律,計(jì)算力為人工智能的飛速發(fā)展提供了強(qiáng)大支撐。
張建中說(shuō):“如果我們看今天的GPU,實(shí)際上它已經(jīng)不再是傳統(tǒng)的圖形處理器了,而在圖靈最新的技術(shù)當(dāng)中,里面已經(jīng)集成了很多不同的核心處理器。”
張建中以自動(dòng)駕駛為例,著重介紹了GPU在推理(Inference)情況下的應(yīng)用。NVIDIA不久前在日本GTC發(fā)布的AGX,可以作為極小的單芯片Xavier對(duì)接自動(dòng)駕駛汽車(chē)的各種不同接口,也可以用兩個(gè)Xavier芯片加上兩個(gè)GPU(名為Drive Pegasus),用在L3~L5等不同的自動(dòng)駕駛場(chǎng)景中。張建中提到很多人以為推理的模型是越小越好,對(duì)精確度的要求并不高。而事實(shí)上,AI的應(yīng)用,尤其是在自動(dòng)駕駛場(chǎng)景下,需要保證其推理平臺(tái)的精確度越高越好,端側(cè)推理也需要強(qiáng)大的計(jì)算平臺(tái)。
國(guó)際AI企業(yè)TOP10:Amazon、Google、Microsoft、Apple、Facebook、DeepMind、NVIDIA、IBM、Boston Dynamics、Waymo
AI WORLD 2018世界人工智能峰會(huì)重磅發(fā)布了AI領(lǐng)域年度大獎(jiǎng)——AI Era創(chuàng)新大獎(jiǎng),NVIDIA Drive Xavier成功入圍「AI產(chǎn)品影響力TOP10」。NVIDIA憑借領(lǐng)先的技術(shù)成功登榜「國(guó)際AI企業(yè)TOP10」,NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛也被評(píng)選為「華人AI人物TOP10」。
AI華人影響力TOP10:陳天石、胡郁、黃仁勛、李飛飛、劉慶峰、王海峰、王小川、吳恩達(dá)、顏水成、余凱
AI產(chǎn)品影響力TOP10:寒武紀(jì)智能芯片MLU100、華為麒麟980、曠視Brain++、訊飛翻譯機(jī)2.0、百度Apollo3.0、阿里云ET城市大腦、英偉達(dá)Drive Xavier、百度大腦3.0、浪潮AI服務(wù)器、阿里量子計(jì)算云平臺(tái)
NVIDIA全球副總裁、中國(guó)區(qū)總經(jīng)理張建中也在此次峰會(huì)上分享了以《AI與自動(dòng)駕駛》為主題的演講,讓人們看到更全面的英偉達(dá),以下為演講的主要內(nèi)容:
張建中:尊敬的各位來(lái)賓,大家上午好!NVIDIA是一家AI Computing Company,過(guò)去我們每天的工作都在不停進(jìn)步,把AI的基礎(chǔ)架構(gòu)和在每一個(gè)不同深度學(xué)習(xí)的模型架構(gòu)(Framework)的加速作為我們的研究方向。
我相信如果你們參加我們的GTC( GPU Technology Conference,GPU 技術(shù)大會(huì)))就會(huì)發(fā)現(xiàn),在過(guò)去的幾年中,摩爾定律的發(fā)明者所講述的CPU計(jì)算性能,隨著每年每隔一代的制程,加上CPU的研發(fā)性能都在不停地提升,但隨著最近幾年的變化,摩爾定律遇到了一定的難度,因?yàn)槲锢順O限導(dǎo)致CPU的性能無(wú)法像以前那么快地飛速成長(zhǎng)。
當(dāng)然,在計(jì)算的過(guò)程中,我們發(fā)現(xiàn)浮點(diǎn)計(jì)算以及并行計(jì)算領(lǐng)域,GPU的性能還是能夠保持持續(xù)的增長(zhǎng),其中的主要原因并不是由于制程的變化,大部分計(jì)算性能的提升是來(lái)自于幾個(gè)方面的結(jié)果:首先要有一個(gè)很好的架構(gòu)(Architecture),要把并行計(jì)算的架構(gòu)設(shè)計(jì)能夠適應(yīng)新的計(jì)算的需要。其次,還要有一個(gè)很好的軟件支持,這種Software SDK支持并行計(jì)算的速度成長(zhǎng),對(duì)整體GPU性能的提升是非常重要的。當(dāng)然還涉及很多的應(yīng)用層面,所以從SDK到芯片再到應(yīng)用層面的結(jié)合,我們就可以看到GPU的性能在每一代的計(jì)算方面的提升是非常驚人的。
如果看一看過(guò)去每隔十年的發(fā)展,GPU本身的計(jì)算速度大概是呈現(xiàn)1000倍地成長(zhǎng),以這么快的成長(zhǎng)速度才能支撐今天人工智能深度學(xué)習(xí)的計(jì)算力要求,也正是因?yàn)镚PU計(jì)算力的提升,大概在今后的幾年中,它的速度應(yīng)該也會(huì)一直不停地增加。
GPU是做AI和深度學(xué)習(xí)最好的架構(gòu)
近日,Jensen(黃仁勛)在日本GTC上了在推理(Inference)情況下,使用我們最新的架構(gòu)圖靈,這種GPU用在推理時(shí),它的性能其實(shí)比帕斯卡架構(gòu)提升差不多10倍數(shù)量級(jí),這樣的數(shù)量級(jí)在于圖靈Architecture的變化。如果看這種AI Interflow Performance可以看到大概是260Tops,這樣的速度可以幫助我們很快地、快速地處理大量人以前無(wú)法處理的信息,尤其是在、視頻的管理、語(yǔ)音的翻譯,大量的計(jì)算速度都可以在云端快速地透過(guò)T4幫助我們實(shí)現(xiàn)。
這個(gè)架構(gòu)本身來(lái)自于新的架構(gòu)(Architecture),有人說(shuō)GPU是不是一個(gè)最好的架構(gòu)來(lái)做AI呢?很多人都在爭(zhēng)論這個(gè)問(wèn)題,如果我們看今天的GPU,實(shí)際上它已經(jīng)不再是傳統(tǒng)的圖形處理器了,而在圖靈最新的技術(shù)當(dāng)中,里面已經(jīng)整合了多種不同的核心處理器,包括今天要跟大家分享的RTX。
RTX實(shí)現(xiàn)了在過(guò)去計(jì)算機(jī)圖形當(dāng)中最難做的一件事情,很多人以前在計(jì)算機(jī)圖形領(lǐng)域的研究就會(huì)發(fā)現(xiàn),RTX以前是要靠一個(gè)非常非常龐大的超級(jí)計(jì)算機(jī)幫助我們實(shí)現(xiàn),但是如果要做到實(shí)時(shí)計(jì)算的話(huà),工作量是巨大的。上次我們GTC Demo就實(shí)現(xiàn)了用實(shí)時(shí)去做光線追蹤(Ray Tracing)的第一次成功,所用的正是NVIDIA的DGX,4個(gè)最新的處理器Volta架構(gòu)實(shí)現(xiàn)實(shí)時(shí)光線追蹤,但是用圖靈架構(gòu)的處理器就可以直接做到實(shí)時(shí)。這種RTX技術(shù)不光是幫助我們?nèi)プ鰧?shí)時(shí)的光線追蹤,同時(shí)可以去做很多AI的應(yīng)用,其中包括里面集成的AI推理代碼。
如果我們看整個(gè)RTX的重要性,可以發(fā)現(xiàn)其實(shí)RTX真正改變了我們今天所有的圖形應(yīng)用計(jì)算,今后你們所看到的電影沒(méi)有必要再去等待很長(zhǎng)時(shí)間去做后期的制作,導(dǎo)演用RTX就可以實(shí)時(shí)決定電影后期制作的效果,無(wú)需等待,以前的Rundown可以被一張顯卡代替。當(dāng)然,RTX帶來(lái)的最大改變是內(nèi)容制作的真實(shí)度,可以看到今后游戲行業(yè)的變化會(huì)是巨大的,如今的游戲在里面的每一楨畫(huà)面要靠GPU做實(shí)時(shí)的渲染,但在今后可能不一定要再去靠GPU100%渲染,可以靠AI和光線追蹤,得到的效果就會(huì)變成照片級(jí)的游戲畫(huà)面效果,計(jì)算機(jī)制作的游戲和后期電影的效果和我們看到的每張大片都是一樣的。
關(guān)于這些實(shí)時(shí)光線追蹤達(dá)到的效果,可以看到無(wú)論是機(jī)理的表現(xiàn)方面,還是材質(zhì)的反映方面都可以達(dá)到更加真實(shí)的性能。以前我們看到的材料,比如金屬、皮質(zhì)、木材,每種材料的表現(xiàn)是不一樣的,今天在實(shí)時(shí)光線追蹤的技術(shù)可以把這些材料通過(guò)技術(shù)描述出來(lái),通過(guò)GPU渲染出想要的不同材質(zhì)的效果。因?yàn)檫@是實(shí)時(shí)光線追蹤,所有光線的陰影都是很Soft、很真實(shí)的。如果我們有機(jī)會(huì)去看RTX Demo的話(huà),可以看到在多光源不同的環(huán)境下的渲染效果跟真實(shí)的場(chǎng)景是沒(méi)有分別的。
當(dāng)然,如果光線追蹤帶來(lái)的特效反映在不同的光影反射的情況中,其實(shí)在其它的方面可以增加更好的表現(xiàn)力,比如做人臉表情的模擬仿真,可以把它變得更加真實(shí),例如,3D作出的人臉表情的模仿,和真人的效果基本上沒(méi)有差別。
AI應(yīng)用需要高精確度的推理平臺(tái)
單看GPU的計(jì)算力在不同場(chǎng)景下的應(yīng)用,實(shí)際上給我們帶來(lái)的變化遠(yuǎn)遠(yuǎn)不止在服務(wù)器端。AI最大的應(yīng)用其實(shí)是在兩端的:一是訓(xùn)練,二是推理。既然有強(qiáng)大的計(jì)算力把訓(xùn)練的模型建好,那么在推理這一端是不是要強(qiáng)大的計(jì)算力平臺(tái)讓它去包括呢?
其實(shí)答案是肯定的,很多人以為推理的模型是越小越好,但是在很多的場(chǎng)景下面、很多的環(huán)境下,AI的應(yīng)用要保證它的精確度越高越好,尤其是在自動(dòng)駕駛場(chǎng)景下,安全幾乎已經(jīng)成為所有人關(guān)心的第一大問(wèn)題。既然是這樣,怎么提高它的安全性呢?除了此前周志華教授介紹的各種不同魯棒性的研發(fā)之外,我們還可以建立很好的模型,但歸根結(jié)底還是要有一個(gè)很強(qiáng)大的計(jì)算平臺(tái)迅速地把你的結(jié)果算出來(lái)。
要想建立一個(gè)很強(qiáng)大的,或者是人工智能推理平臺(tái),NVIDIA推出的AGX芯片就是一個(gè)SoC,但是可以做到有強(qiáng)大的計(jì)算能力,最高可以達(dá)到300個(gè)Tops,所以可以看到AI推理速度有多快。如果只看這個(gè)芯片本身,可以看到它不只是一顆CPU,當(dāng)然也不只是一顆GPU,里面有8個(gè)核心的CPU處理能力,同時(shí)里面還有視頻處理器、圖像處理器,接入各種不同的傳感器,可以支持所有工業(yè)級(jí)的不同接口。
如果我們來(lái)看這個(gè)系統(tǒng)芯片,它的應(yīng)用能力基本上可以應(yīng)用在各種不同的機(jī)器自動(dòng)應(yīng)用產(chǎn)品,英偉達(dá)也在日本發(fā)布了NVIDIA AGX,AGX是專(zhuān)門(mén)用來(lái)處理自動(dòng)智能工具的一個(gè)嵌入式(Embedded)平臺(tái),基本上可以變成單片應(yīng)用或者是雙片應(yīng)用,加上一個(gè)獨(dú)立的GPU應(yīng)用,所以應(yīng)用場(chǎng)景會(huì)非常廣泛,可以看到AGX是一個(gè)非常小的單芯片接上汽車(chē)的自動(dòng)駕駛各種不同的接口,也可以是雙芯片獨(dú)立的GPU,我們把它叫做 Drive Pegasus,可以在不同的場(chǎng)景使用,包括汽車(chē)駕駛的Level3,甚至Level5,也可以應(yīng)用在其它不同的機(jī)器人場(chǎng)景當(dāng)中。
如果我們看一看兩種不同的應(yīng)用場(chǎng)景,我們相信凡是能夠運(yùn)動(dòng)或者移動(dòng)的物體今后都將是智能化的,任何一部車(chē)無(wú)論是轎車(chē)、卡車(chē)、運(yùn)貨的小車(chē),或者是農(nóng)用的機(jī)械工具等等都可以使用AGX實(shí)現(xiàn)自動(dòng)化。
NVIDIA推出汽車(chē)自動(dòng)駕駛測(cè)試仿真系統(tǒng),仿真成為重要一環(huán)
除了硬件本身的計(jì)算平臺(tái)之外,它是不夠的,怎樣賦能一個(gè)100%或者能夠全智能化的機(jī)器人?我們要給它提供一整套的軟件,NVIDIA基本上把整個(gè)的定位、感知、決策和各種不同的傳感器接口都設(shè)計(jì)得很好,所以我們有軟件接口、硬件接口,軟件架構(gòu)方面NVIDIA可以提供所有的Drive全套的N2N Software集成。
所有的這些智能機(jī)器人當(dāng)中,最核心的模塊就是今后很多公司花了很多時(shí)間研發(fā)的感知系統(tǒng),這種感知系統(tǒng)的研發(fā)核心的裝置或者核心的系統(tǒng)還是要設(shè)計(jì)N2N的感知系統(tǒng)基礎(chǔ)架構(gòu)。首先要有一個(gè)很好的、很強(qiáng)大數(shù)據(jù)能力的數(shù)據(jù)中心,其中必須要有足夠強(qiáng)大的計(jì)算力處理感知、前端、收集各種不同的標(biāo)注數(shù)據(jù),把這些數(shù)據(jù)在數(shù)據(jù)中心進(jìn)行處理以后才可以得到想要的模型,應(yīng)用在我們各個(gè)不同的智能機(jī)器人里面。
今后如果我們?nèi)タ凑麄€(gè)自動(dòng)駕駛的研發(fā),比如測(cè)試自動(dòng)駕駛的模型,仿真(Simulation)是很重要的一環(huán)。NVIDIA推出的汽車(chē)自動(dòng)駕駛測(cè)試仿真系統(tǒng)(DRIVE Constellation),運(yùn)行NVIDIA DRIVE Sim軟件 ,可以測(cè)試汽車(chē)上路之前研發(fā)的各種不同的算法在計(jì)算機(jī)當(dāng)中、在云端和在(Data Center)進(jìn)行測(cè)試模擬。當(dāng)然,模擬的環(huán)境和真實(shí)的環(huán)境一樣,我們可以做到各種不同環(huán)境的模擬測(cè)試。當(dāng)然,最后的感知效果是的可以看見(jiàn)的:在不同的氣候和路況下都能夠使用我們自動(dòng)駕駛的算法。
一個(gè)好的自動(dòng)駕駛環(huán)境當(dāng)中,NVIDIA Drive考慮的是從數(shù)據(jù)的感知到本身平臺(tái)的系統(tǒng)模擬,再到最后真正在汽車(chē)上實(shí)際運(yùn)行的NVIDIA Drive我們都有N2N的解決方案。如果只是我們自己去研發(fā)肯定不能完善,或者不能很快地讓自動(dòng)駕駛的產(chǎn)品和技術(shù)上市,我們?cè)谌蛴谐^(guò)450家的合作伙伴,這些合作伙伴每一個(gè)都在用NVIDIA Drive平臺(tái),無(wú)論是大大小小的AGX平臺(tái)或者是在NVIDIA Drive Software上進(jìn)行自動(dòng)駕駛的研發(fā)。我們也希望今年在中國(guó)的GTC上面能夠展示我們?cè)谥袊?guó)本土的自動(dòng)駕駛研發(fā)方面的科研成果,歡迎大家到時(shí)候去蘇州參觀!
-
gpu
+關(guān)注
關(guān)注
28文章
4776瀏覽量
129358 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8908瀏覽量
137799 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5515瀏覽量
121553
原文標(biāo)題:GPU是做AI和深度學(xué)習(xí)最好的架構(gòu)?端側(cè)推理也需要強(qiáng)大的計(jì)算平臺(tái)!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論