華為GPU Turbo這一項(xiàng)技術(shù)首先是在6月6日的榮耀Play上搭載,在發(fā)布會(huì)前余承東對(duì)自家GPU Turbo技術(shù)的宣傳語(yǔ)就是”一項(xiàng)很?chē)樔说募夹g(shù)”。
根據(jù)官方解釋?zhuān)篏PU Turbo是一種類(lèi)似汽車(chē)上渦輪增壓的技術(shù),是一種軟硬協(xié)同的圖形加速技術(shù),能夠提高手機(jī)GPU的性能,圖形處理效率提高60%。
這項(xiàng)技術(shù)公布后,有很多媒體也做了相關(guān)的測(cè)試,數(shù)據(jù)顯示其確實(shí)能提高游戲的幀率和畫(huà)面流暢感和驚喜度,同時(shí)也優(yōu)化了發(fā)熱和降低功耗。不過(guò)官方對(duì)這項(xiàng)技術(shù)的實(shí)現(xiàn)形式卻并沒(méi)有說(shuō)仔細(xì),只對(duì)外說(shuō)了這是一個(gè)軟硬件協(xié)同優(yōu)化的技術(shù)。
有媒體提到:GPU Turbo并沒(méi)有官方形容得那么”嚇人”,從人工智能角度來(lái)看,它其實(shí)是基于智能場(chǎng)景識(shí)別調(diào)度優(yōu)化的,現(xiàn)在看來(lái)其并沒(méi)有針對(duì)某一游戲?qū)iT(mén)優(yōu)化,而是全局性的,背后涉及到比較復(fù)雜的算法。
可以確認(rèn)的是,GPU Turbo這項(xiàng)圖形加速技術(shù)確實(shí)能增強(qiáng)圖像處理游戲的體驗(yàn),不過(guò)他具體的原理是怎樣卻并不清晰。在今年2018 IFA展會(huì)上,榮耀手機(jī)總裁趙明便舉行了一場(chǎng)面對(duì)全球媒體的GPU Turbo的溝通會(huì)。會(huì)后知名科技媒體AnandTech通過(guò)對(duì)榮耀技術(shù)人員采訪和溝通,總算把這項(xiàng)技術(shù)的實(shí)現(xiàn)理清了。
GPU Turbo的機(jī)型升級(jí)計(jì)劃
GPU Turbo是一項(xiàng)軟件技術(shù),他能夠通過(guò)升級(jí)算法用在舊設(shè)備上,令他們的性能得到提高。隨著今年EMUI 9.0的發(fā)布,GPU Turbo技術(shù)也將會(huì)升級(jí)到2.0的版本。
在今年接下來(lái)的幾個(gè)月里面,華為已經(jīng)制定了其華為和榮耀機(jī)型升級(jí)搭載GPU Turbo技術(shù)的計(jì)劃,保證其主流的機(jī)器都搭載這項(xiàng)最新的技術(shù)。華為方面也承諾,所有的設(shè)備,不論你的硬件是什么配置,其都會(huì)得到一定的GPU性能提升。
從這份升級(jí)計(jì)劃里面可以看到,GPU Turbo的升級(jí)包含了華為和榮耀近兩年來(lái)所發(fā)布的機(jī)型。
AnandTech方面談到:GPU Turbo在發(fā)布后,網(wǎng)上有大量關(guān)于這個(gè)技術(shù)的宣傳和營(yíng)銷(xiāo)文章,不過(guò)可惜并沒(méi)有任何關(guān)于GPU Turbo技術(shù)的解析,同時(shí)它如何工作也是不曉得的。
在今年的IFA上,通過(guò)這場(chǎng)GPU Turbo的媒體溝通會(huì),終于有機(jī)會(huì)與華為的軟硬件工程師溝通,把GPU Turbo的不為人知的秘密解開(kāi)。
GPU Turbo實(shí)際是AI調(diào)度技術(shù)?
在GPU Turbo技術(shù)的一些推廣上,華為聲稱(chēng)其能夠在某些情況下提高60%的GPU性能,同時(shí)把功耗降低30%。實(shí)際了解莫爾定律和有一定技術(shù)常識(shí)的讀者都了解,在不提升工藝制程的情況下,能把GPU性能提升接近60%,而且功耗降低30%,這是基本不可能的。要想想,麒麟960到970,16nm提升到10nm,其CPU、GPU的性能提升也只是30%左右。
那這項(xiàng)技術(shù)為什么有這么神奇的效果?AnandTech在IFA上通過(guò)與EMUI軟件團(tuán)隊(duì)和華為硬件團(tuán)隊(duì)交流,終于理清和明白GPU Turbo技術(shù)下的實(shí)現(xiàn)細(xì)節(jié)。
首先海思芯片團(tuán)隊(duì)明確表示,這是一種軟件技術(shù)。GPU Turbo的性能提升機(jī)制便是輔助調(diào)度整個(gè)芯片各部件的協(xié)同運(yùn)行,有一點(diǎn)調(diào)度管理員的意味。這一個(gè)調(diào)度機(jī)制完全是依靠軟件的方式。
這也能解析為什么華為能把這項(xiàng)技術(shù)應(yīng)用到舊設(shè)備上,因?yàn)樗⒉恍枰钚掠布闹С?,也就是說(shuō),即使沒(méi)有NPU,它也能應(yīng)用,只不過(guò)這部分運(yùn)算可能便是CPU方面負(fù)責(zé),相比較單獨(dú)的NPU,能效上會(huì)有一些差別。
AnandTech還提到,在IFA上的麒麟980的發(fā)布會(huì)上,首次透露了這項(xiàng)運(yùn)作方式名為” AI Loading Prediction Technology”,翻譯過(guò)來(lái)叫做AI加載預(yù)測(cè)技術(shù)。
從上圖可以看到,通過(guò)AI加載預(yù)測(cè),對(duì)比傳統(tǒng)的游戲加載機(jī)制,前者能夠在游戲獲得更流暢的游戲體驗(yàn),同時(shí)整體功耗要更加低。
AI模型構(gòu)建與訓(xùn)練
GPU Turbo利用華為所構(gòu)建的AI模型進(jìn)行工作,而他們稱(chēng)之為TensorFlow 神經(jīng)網(wǎng)絡(luò)模型。這個(gè)模型是由華為所構(gòu)建和進(jìn)行預(yù)先的訓(xùn)練,令其具有學(xué)習(xí)的能力。
AI神經(jīng)網(wǎng)絡(luò)可以根據(jù)游戲運(yùn)行時(shí)的幀率、功耗等狀態(tài)進(jìn)行不斷學(xué)習(xí),達(dá)到提升性能降低功耗的目的。
再說(shuō)深一層,實(shí)際這個(gè)AI神經(jīng)網(wǎng)絡(luò)優(yōu)化的內(nèi)容是每個(gè)手機(jī)運(yùn)行某一個(gè)游戲時(shí)的DVFS控制。
DVFS 即動(dòng)態(tài)電壓頻率調(diào)整,動(dòng)態(tài)技術(shù)則是根據(jù)芯片所運(yùn)行的應(yīng)用程序?qū)τ?jì)算能力的不同需要,動(dòng)態(tài)調(diào)節(jié)芯片的運(yùn)行頻率和電壓(對(duì)于同一芯片,頻率越高,需要的電壓也越高),從而達(dá)到節(jié)能的目的。
如果要令芯片有效節(jié)能,單純降低功率是不夠的,還需要進(jìn)行電壓的降低和動(dòng)態(tài)調(diào)節(jié)。因此GPU Turbo實(shí)際是通過(guò)AI神經(jīng)網(wǎng)絡(luò)模型對(duì)DVFS進(jìn)行精細(xì)化的調(diào)節(jié)。
在AI模型學(xué)習(xí)階段,它會(huì)動(dòng)態(tài)分析和調(diào)整芯片的DVFS的參數(shù),實(shí)現(xiàn)最佳的能耗比。這里說(shuō)起來(lái)比較玄乎,我們可以這樣理解,這個(gè)AI神經(jīng)網(wǎng)絡(luò)模型便是要找到DVFS的甜點(diǎn),也就是最佳動(dòng)態(tài)平衡。
我們理解的游戲流暢不一定都是每時(shí)每刻都要達(dá)到60幀以上,AI模型通過(guò)學(xué)習(xí),在保證游戲的流暢情況下(有可能低于我們常規(guī)理解的60幀),調(diào)整CPU、GPU、RAM等部件的協(xié)作最佳DVFS狀態(tài)。
這樣看,AI神經(jīng)網(wǎng)絡(luò)模型是具有很強(qiáng)的學(xué)習(xí)能力,而這個(gè)初始模型是一個(gè)軟件算法存在,可以寫(xiě)入到手機(jī)的系統(tǒng)固件當(dāng)中,這樣便可以令舊設(shè)備也具有GPU Turbo的能力。
AI神經(jīng)網(wǎng)絡(luò)模型會(huì)因應(yīng)每部手機(jī)的硬件資源的差異,進(jìn)行每部機(jī)器的個(gè)性化深度學(xué)習(xí),能夠根據(jù)每部機(jī)器的不同而做不同的調(diào)度優(yōu)化。
在經(jīng)過(guò)訓(xùn)練后,其可以輸出最適合特定場(chǎng)景的DVFS設(shè)置,這個(gè)場(chǎng)景可以是日常上網(wǎng)、看視頻、拍照、游戲等。GPU Turbo的工作機(jī)制可以應(yīng)用到硬件層上,并且動(dòng)態(tài)自動(dòng)地調(diào)整DVFS,保證體驗(yàn)的前提下也能更有效降低整機(jī)的功耗。
NPU加速AI神經(jīng)網(wǎng)絡(luò)模型的工作
前面已經(jīng)說(shuō)到,GPU Turbo的AI神經(jīng)網(wǎng)絡(luò)模型是純軟件的技術(shù),并不需要特定的硬件,可是假如為它配備特定的運(yùn)算模塊NPU,這將會(huì)大大提高它的效率。
NPU可以加速AI神經(jīng)網(wǎng)絡(luò)模型的運(yùn)算,而在沒(méi)有NPU模塊的前提下,假如要引入GPU Turbo技術(shù),這部分的運(yùn)算操作可以讓CPU代勞,不過(guò)這必然效率上是不如專(zhuān)門(mén)的NPU模塊,估計(jì)或多或少會(huì)造成渲染的延遲,表現(xiàn)起來(lái)就是游戲的流暢度差一點(diǎn)。
這里就可以說(shuō)明,為什么麒麟960即使沒(méi)有NPU模塊,華為Mate 9等搭載麒麟960的手機(jī)同樣能夠引入GPU Turbo。
華為方面已經(jīng)證實(shí)了這些AI神經(jīng)網(wǎng)絡(luò)模型采用的是16位的浮點(diǎn)運(yùn)算,這意味著往后的新手機(jī)設(shè)備,如麒麟980的機(jī)器,可能會(huì)通過(guò)基于新NPU支持的INT8模型做進(jìn)一步的優(yōu)化。
本質(zhì)上GPU Turbo就是一個(gè)DVFS的運(yùn)行機(jī)制,它能夠預(yù)測(cè)GPU渲染圖像下一幀的硬件需求而進(jìn)行芯片各部分的協(xié)作調(diào)整。
與那些傳統(tǒng)的DVFS的調(diào)整算法相比,它的精度更高,同時(shí)也更穩(wěn)定準(zhǔn)確,因?yàn)閭鹘y(tǒng)的算法只是通過(guò)簡(jiǎn)單的硬件檢測(cè)GPU工作負(fù)載狀態(tài)而進(jìn)行事后的調(diào)節(jié),而GPU Turbo是進(jìn)行預(yù)先學(xué)習(xí)預(yù)先判斷,效率和效果上有很大的差異。
AnandTech指出,這項(xiàng)技術(shù)能夠很好對(duì)智能手機(jī)的性能、效率和功耗做一個(gè)優(yōu)化平衡,因此他們對(duì)這項(xiàng)技術(shù)還是表示肯定的。這項(xiàng)技術(shù)的思路可以推廣到其他領(lǐng)域,例如個(gè)人電腦等等。
不過(guò)這項(xiàng)技術(shù)的一個(gè)弱點(diǎn)便是需要AI神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,不同的設(shè)備不同的游戲的訓(xùn)練學(xué)習(xí)時(shí)間都是不一樣的。華為方面并沒(méi)有說(shuō)明培訓(xùn)學(xué)習(xí)一款游戲需要花費(fèi)多少時(shí)間,不過(guò)華為方面已經(jīng)著手開(kāi)始聯(lián)合游戲開(kāi)發(fā)商進(jìn)行特定的游戲優(yōu)化。畢竟進(jìn)行特定優(yōu)化后要比全局性GPU Turbo后的游戲體驗(yàn)提升更大。
GPU Turbo不需要被”神化”
我們已經(jīng)大致了解了GPU Turbo是如何運(yùn)作,如何提升GPU圖形方面的性能,因此我們透過(guò)本質(zhì)來(lái)看事實(shí),它確實(shí)對(duì)性能有一定的提升,也具備市場(chǎng)價(jià)值,可是我們不能神化它。
AnandTech對(duì)比了華為P20和榮耀Play的游戲體驗(yàn),這兩個(gè)設(shè)備都是采用了相同的芯片和內(nèi)存,只不過(guò)在其他元器件有差異。
華為P20(沒(méi)有GPU Turbo)
榮耀Play(GPU Turbo)
華為P20暫時(shí)沒(méi)有升級(jí)引入GPU Turbo,而榮耀Play是第一款搭載GPU Turbo技術(shù)的機(jī)器。
我們看到兩者在游戲中,通過(guò)原始幀率數(shù)據(jù)是很難分別哪一款設(shè)備具有GPU Turbo,不過(guò)榮耀Play在游戲中還是有一個(gè)明顯的優(yōu)勢(shì),那就是游戲渲染場(chǎng)景時(shí)候的功率是3.9W,這比華為P20的4.7W要小。
當(dāng)然這是整機(jī)的總功率,我們不能完全排除可能屏幕等其他元器件方面的功率差異,但是這兩款設(shè)備的功率差只有15%。即使加上其他手機(jī)元器件的差值,其還是與官方宣稱(chēng)的30%以上的功耗差異相距甚遠(yuǎn)。
因此這里要說(shuō)明的是,GPU Turbo確實(shí)能提升GPU性能,可是我們要對(duì)官方宣稱(chēng)的數(shù)據(jù)進(jìn)行理性看待。不一樣的設(shè)備不一樣的游戲都會(huì)對(duì)提升差異幅度有很大的影響,不要把GPU Turbo神化了。
當(dāng)然GPU Turbo是實(shí)實(shí)在在提升GPU性能的一個(gè)創(chuàng)新方案,通過(guò)軟件算法去彌補(bǔ)麒麟GPU方面的弱項(xiàng)。不過(guò)我們也要明白,對(duì)比高通驍龍Adreno,麒麟的Mali GPU的硬件性能還是要落后不少。
即使有GPU Turbo技術(shù)的加持,榮耀Play在游戲性能和體驗(yàn)上還是與驍龍845的手機(jī)設(shè)備有較大的差距,因?yàn)樵谟布矫娴男阅懿町愐獑渭兛寇浖?lái)消除,這是不太可能的。
總結(jié)
在IFA上,麒麟980芯片正式發(fā)布,我們從一些演示幻燈片看到GPU Turbo對(duì)麒麟980芯片組方面的性能助力。實(shí)際GPU Turbo對(duì)于增強(qiáng)其GPU性能的提升并沒(méi)有很大,只有10%左右。
當(dāng)中原因可能麒麟980上面改進(jìn)了工作負(fù)載的電壓調(diào)整機(jī)制,GPU方面性能也得到硬件層面上(制做工藝、晶體管、渲染單元數(shù)量)的提升,而GPU Turbo這個(gè)軟件方面的性能增強(qiáng)數(shù)值在更趨于可信和合理的范圍內(nèi)。
無(wú)可否認(rèn),GPU Turbo技術(shù)確實(shí)是能夠增強(qiáng)GPU方面的性能,提升游戲的體驗(yàn)。我們應(yīng)該給予開(kāi)發(fā)這個(gè)技術(shù)的團(tuán)隊(duì)贊賞,同時(shí)在如今日益競(jìng)爭(zhēng)激烈的半導(dǎo)體芯片環(huán)境里面,應(yīng)該鼓勵(lì)更多芯片設(shè)計(jì)公司開(kāi)發(fā)出類(lèi)似GPU Turbo這類(lèi)真實(shí)提升性能的技術(shù)。
對(duì)于用戶(hù)能提升游戲等各方面的體驗(yàn),對(duì)于公司來(lái)說(shuō)是創(chuàng)新差異化的需求,對(duì)于市場(chǎng)來(lái)說(shuō)是推動(dòng)整個(gè)芯片行業(yè)發(fā)展的軟動(dòng)力。
-
華為
+關(guān)注
關(guān)注
216文章
34532瀏覽量
253001 -
gpu
+關(guān)注
關(guān)注
28文章
4774瀏覽量
129352
原文標(biāo)題:深度揭秘:華為GPU Turbo技術(shù)是怎樣一回事?
文章出處:【微信號(hào):zengshouji,微信公眾號(hào):MCA手機(jī)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論