NVIDIA 發(fā)布了世界上最小、最先進(jìn)的用于自主機(jī)器人和邊緣計(jì)算設(shè)備的嵌入式 AI超級(jí)計(jì)算機(jī) Jetson Xavier NX 。 Jetson Xavier NX 能夠在緊湊的 70x45mm 外形中部署服務(wù)器級(jí)性能,在 15W 的功率下可提供多達(dá) 21 臺(tái)計(jì)算機(jī), MLPerf Inference 0.5 是基于 NVIDIA’s Xavier 引腳的 Jetson Nano 的最新計(jì)算結(jié)果,部署工作負(fù)載可能會(huì)受到限制,比如基于成本和性能的限制。
圖 2 : Jetson Xavier NX 處理器引擎的框圖,包括高速 I / O 和內(nèi)存結(jié)構(gòu)。
如圖 2 所示, Jetson Xavier NX 包括集成的 384 核 NVIDIA Volta GPU , 48 個(gè)張量核, 6 核 NVIDIA Carmel ARMv8 。 2 64 位 CPU , 8GB 128 位 LPDDR4x ,雙 NVIDIA 深度學(xué)習(xí)加速器( NVDLA )引擎, 4K 視頻編碼器和解碼器,專用攝像機(jī)攝取,最多 6 個(gè)同時(shí)高分辨率傳感器流, PCIe Gen 3 擴(kuò)展、雙顯示端口/ HDMI 4K 顯示器、 USB 3 。 1 和 GPIO ,包括 SPI 、 I2C 、 I2S 、 CAN 總線和 UART 。有關(guān)特性列表,請(qǐng)參閱下表 1 ,有關(guān)完整規(guī)格,請(qǐng)參閱 Jetson Xavier NX 模塊數(shù)據(jù)表 。共享內(nèi)存結(jié)構(gòu)允許處理器自由地共享內(nèi)存,而不會(huì)產(chǎn)生額外的內(nèi)存拷貝(稱為零拷貝),這有效地提高了系統(tǒng)的帶寬利用率和吞吐量。
表 1 : Jetson Xavier NX 計(jì)算模塊特性和功能
* CPU 4 / 6 核模式下的最大工作頻率為 1400MHz ,雙核模式下的最大工作頻率為 1900MHz
?最大并發(fā)流數(shù),達(dá)到總吞吐量。支持的視頻編解碼器: H 。 265 、 H 。 264 、 VP9
有關(guān)具體的編解碼器和配置文件規(guī)范,請(qǐng)參閱 Jetson Xavier NX 模塊數(shù)據(jù)表 。
???每通道 2 英鎊/ MIP ,總計(jì) 2 英鎊。
? PCIe 1 × 1 僅支持根端口, 1 × 1 / 2 / 4 支持根端口或端點(diǎn)模式
^工作溫度范圍, Xavier SoC 結(jié)溫( Tj )
Jetson Xavier NX 由 NVIDIA 完整的 CUDA -X 軟件棧和 JetPack SDK 開發(fā)包 為 AI 開發(fā)提供支持,除了實(shí)時(shí)計(jì)算機(jī)視覺外,還可以在多個(gè)高分辨率傳感器流上同時(shí)運(yùn)行流行的機(jī)器學(xué)習(xí)框架和復(fù)雜的 DNN ,在全桌面 Linux 環(huán)境中加速圖形和豐富的多媒體應(yīng)用程序。 Jetson 與 NVIDIA 的 AI 加速計(jì)算平臺(tái)的兼容性使得開發(fā)更加容易,云和 edge 之間的 MIG 無(wú)縫匹配。
設(shè)計(jì)抵押品 Jetson Xavier NX 設(shè)計(jì)指南 NX 模塊將于 2020 年 3 月面市,售價(jià) 399 美元,嵌入式設(shè)計(jì)師可以參考可供下載的 Jetson ,包括 Xavier ,為 Jetson Xavier NX 模塊創(chuàng)建生產(chǎn)設(shè)備和系統(tǒng)。與 Jetson Nano 的引腳兼容性允許共享設(shè)計(jì)和直接的技術(shù)插入升級(jí)到 Jetson Xavier NX 。除了提供現(xiàn)成的載體、傳感器和配件外, Jetson 生態(tài)系統(tǒng) 的硬件設(shè)計(jì)合作伙伴還能夠提供定制設(shè)計(jì)服務(wù)和系統(tǒng)集成。
軟件開發(fā)人員現(xiàn)在可以開始為 Jetson Xavier NX 構(gòu)建人工智能應(yīng)用程序,方法是使用 Jetson AGX Xavier 開發(fā)工具包,并將 設(shè)備配置修補(bǔ)程序 應(yīng)用到 JetPack 上,使設(shè)備的行為類似于 Jetson Xavier NX 。通過(guò)軟件,它將改變可用的 CPU 和 GPU 核心的數(shù)量,此外還可以設(shè)置整個(gè)系統(tǒng)的核心時(shí)鐘頻率和電壓。該補(bǔ)丁是完全可逆的,可用于在硬件可用之前近似于 Jetson Xavier NX 的性能。
Jetson Xavier NX 定義了 10 和 15W 的默認(rèn)電源模式,根據(jù)活動(dòng)模式,可實(shí)現(xiàn) 14 到 21 個(gè)峰值性能。用于管理電源配置文件的 nvpmodel 工具可調(diào)整 CPU 、 GPU 、內(nèi)存控制器和其他 SoC 時(shí)鐘的最大時(shí)鐘頻率,以及在線 CPU 集群的數(shù)量 – 這些設(shè)置如表 2 所示,適用于 Jetson Xavier NX 的預(yù)定義 10W 和 15W 模式。 CPU 分為三組,每組 2 個(gè)核, 4 / 6 核模式下的最大工作頻率為 1400MHz ,雙核模式下的最高工作頻率為 1900MHz ,對(duì)于可能需要更高單線程性能和多線程性能的應(yīng)用而言,最高工作頻率為 1900MHz 。
NVIDIA Jetson Xavier NX – Power Modes
表 2 : Jetson Xavier NX 10W 和 15W 電源模式的最大工作頻率和核心配置。
*使用 NVDLA 時(shí), GPU 最大工作頻率為 600MHz ( 10W 模式)和 1000MHz ( 15W 模式)
根據(jù)工作負(fù)載,動(dòng)態(tài)電壓和頻率縮放( DVFS )調(diào)控器在運(yùn)行時(shí)將頻率調(diào)整到活動(dòng) nvpmodel 所定義的最大限制,因此在空閑時(shí)根據(jù)處理器利用率降低功耗。 nvpmodel 工具還可以根據(jù)應(yīng)用需求和 TDP 輕松創(chuàng)建和定制新的電源模式。可以編輯電源配置文件并將其添加到/ etc / NVP 模式。 conf 配置文件和一個(gè) GUI 小部件被添加到 Ubuntu 狀態(tài)欄中,以便在運(yùn)行時(shí)方便地管理和切換電源模式。
深度學(xué)習(xí)推斷基準(zhǔn)
今天 NVIDIA 還宣布,它在 MLPerf 推斷 0 。 5 基準(zhǔn)測(cè)試中占據(jù)了 5 個(gè)類別中的 4 個(gè)類別的榜首,其中 Jetson AGX Xavier 是邊緣計(jì)算 SoC 的領(lǐng)導(dǎo)者,包括所有基于視覺的任務(wù):使用 Mobilenet 和 ResNet-50 進(jìn)行圖像分類,以及使用 SSD Mobilenet 和 SSD ResNet 進(jìn)行目標(biāo)檢測(cè)。 NVIDIA GPUs 是十個(gè)競(jìng)爭(zhēng)芯片架構(gòu)中唯一一個(gè)在 MLPerf 定義的所有五個(gè)推斷測(cè)試中提交結(jié)果的。
為了參考 Jetson 家族成員之間的可伸縮性,我們還測(cè)量了 Jetson Nano 、 Jetson TX2 、 Jetson Xavier NX 和 Jetson AGX Xavier 對(duì)圖像分類、目標(biāo)檢測(cè)、位姿估計(jì)、分割等常用 DNN 模型的推理性能。這些結(jié)果,如下面的圖 3 所示,是用 JetPack 和 NVIDIA 的 TensorRT 推斷加速器庫(kù)運(yùn)行的,該庫(kù)優(yōu)化了網(wǎng)絡(luò)的實(shí)時(shí)性能,該庫(kù)是在流行的 ML 框架(如 TensorFlow 、 PyTorch 、 Caffe 、 MXNet 等)中訓(xùn)練出來(lái)的。
圖 3 。用 TensorRT 來(lái)推斷 Jetson 家族中各種基于視覺的 DNN 模型的性能。
Jetson Xavier NX 的性能比 Jetson TX2 高 10 倍,功耗相同,占地面積小 25% 。在這些基準(zhǔn)測(cè)試期間,每個(gè)平臺(tái)都以最高性能運(yùn)行( MAX-N 模式用于 Jetson AGX Xavier , Xavier NX 和 TX2 為 15W , Nano 為 10W )。最大吞吐量是在批處理大小不超過(guò) 16ms 的延遲閾值的情況下獲得的,否則,對(duì)于平臺(tái)超過(guò)該延遲閾值的網(wǎng)絡(luò),批處理大小為 1 。這種方法在實(shí)時(shí)應(yīng)用程序的確定性低延遲需求和多流用例場(chǎng)景的最大性能之間提供了平衡。
在 Xavier Jetson NX 和 Jetson AGX Xavier 上, NVDLA 引擎和 GPU 同時(shí)以 INT8 精度運(yùn)行,而在 Jetson Nano 和 Jetson TX2 上 GPU 以 FP16 精度運(yùn)行, Jetson Xavier NX 中具有張量核心的 Volta 架構(gòu) GPU 可以達(dá)到 12 。 3 個(gè)計(jì)算頂層,而該模塊的 DLA 引擎每臺(tái)最多可產(chǎn)生 4 。 5 臺(tái)。
除了用 TensorRT 運(yùn)行神經(jīng)網(wǎng)絡(luò)外, ML 框架還可以通過(guò) cuDNN 和 CUDA 加速在 Jetson 上安裝,包括 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 MXNet 、 Keras 等。除了 AWS Greengrass 等物聯(lián)網(wǎng)框架和 Docker 和 Kubernetes 等容器引擎外, Jetson 動(dòng)物園 還包括這些預(yù)構(gòu)建的安裝程序和構(gòu)建說(shuō)明。
開發(fā)突破性的人工智能產(chǎn)品
Jetson Xavier NX 為部署下一代自主系統(tǒng)和智能邊緣設(shè)備開辟了新的機(jī)遇,這些設(shè)備需要在較小、低功耗的空間內(nèi)實(shí)現(xiàn)高性能人工智能和復(fù)雜的 DNN ,比如移動(dòng)機(jī)器人、無(wú)人機(jī)、智能相機(jī)、便攜式醫(yī)療設(shè)備、嵌入式物聯(lián)網(wǎng)系統(tǒng)等等。 NVIDIA 支持 CUDA -X 的 JetPack SDK 提供了開發(fā)尖端 AI 解決方案的完整工具,并以世界領(lǐng)先的性能在云端和邊緣之間擴(kuò)展應(yīng)。
關(guān)于作者
Dustin Franklin 是 NVIDIA 的 Jetson 團(tuán)隊(duì)的開發(fā)人員布道者。 Dustin 擁有機(jī)器人和嵌入式系統(tǒng)方面的背景,他樂于在社區(qū)中提供幫助,并與 Jetson 一起參與項(xiàng)目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5092文章
19177瀏覽量
307679 -
機(jī)器人
+關(guān)注
關(guān)注
211文章
28641瀏覽量
208417 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5076瀏覽量
103722 -
嵌入式AI
+關(guān)注
關(guān)注
0文章
34瀏覽量
898
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論