NVIDIA 數(shù)據(jù)加載庫(DALI)是一個可移植的開源庫,專用于解碼及增強圖像、視頻和語音,從而加速深度學習應用。
什么是 NVIDIA 數(shù)據(jù)加載庫(DALI)?
NVIDIA 數(shù)據(jù)加載庫(DALI)是一個可移植的開源庫,專用于解碼及增強圖像、視頻和語音,從而加速深度學習應用。DALI 通過重疊執(zhí)行訓練和預處理來減少延遲和訓練時間,從而減輕瓶頸影響。DALI 可直接嵌入并替代熱門深度學習框架中內置的數(shù)據(jù)加載程序和數(shù)據(jù)迭代器,由此實現(xiàn)輕松集成或重新遷至不同框架。
使用圖像訓練神經(jīng)網(wǎng)絡時,開發(fā)者首先要將這些圖像標準化。而且,通常還需壓縮圖像以節(jié)省存儲空間。為此,開發(fā)者構建了多階段數(shù)據(jù)處理工作流,其中包括加載、解碼、裁剪、調整大小以及許多其他增強運算符。這些當前在 CPU 上執(zhí)行的數(shù)據(jù)處理工作流已成為瓶頸,限制了整體吞吐量。
DALI 擁有高性能,對于內置的數(shù)據(jù)加載程序和數(shù)據(jù)迭代器而言,是一款出色的替代方案。開發(fā)者現(xiàn)可在 GPU 上運行數(shù)據(jù)處理工作流,從而減少訓練神經(jīng)網(wǎng)絡所需的總時間。使用 DALI 實現(xiàn)的數(shù)據(jù)處理工作流具有可移植性,因為它們能夠輕松地重新遷至 TensorFlow、PyTorch 和 MXNet。
DALI 的主要特性
可跨多個 GPU 透明擴展
加速圖像分類(ResNet-50)、物體檢測(SSD)工作負載和語音識別模型(例如 Jasper 和 RNN-T)
靈活的圖形助力開發(fā)者創(chuàng)建自定義工作流
支持多種數(shù)據(jù)格式:LMDB、RecordIO、TFRecord、COCO、JPEG、wav、flac、ogg、H.264 和 HEVC
開發(fā)者可添加自定義音頻、圖像和視頻處理運算符
審核編輯:湯梓紅
-
NVIDIA
+關注
關注
14文章
5076瀏覽量
103720 -
DALI
+關注
關注
4文章
67瀏覽量
20818
原文標題:DevZone | NVIDIA數(shù)據(jù)加載庫(DALI)
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論