吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優勢

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2025-01-07 09:43 ? 次閱讀

WEKA是可擴展軟件定義數據平臺的先驅,NVIDIA 正在與其合作,將 WEKA 先進的數據平臺解決方案與功能強大的NVIDIA BlueField DPU相結合。

WEKA 數據平臺的高級存儲軟件可充分發揮 AI 和性能密集型工作負載的潛力,而 NVIDIA BlueField DPU 則徹底改變了數據的訪問、移動和安全性。這些前沿技術的集成將開創前所未有的數據管理效率和速度的新時代,并有望重塑高性能數據訪問的格局。

解決高效的 AI 工作流程

AI 的迅速崛起推動了計算能力和網絡速度的指數級增長,對存儲資源提出了非常高的需求。雖然 NVIDIA GPU 提供了令人驚嘆的可擴展、高效的計算能力,但是它們還需要高速的數據訪問。

WEKA 與 NVIDIA 的合作解決了這一挑戰。它們共同滿足了模型訓練和推理任務(包括檢索增強生成,RAG)對 PB 級數據進行高帶寬網絡訪問的關鍵需求。

關于 RAG 的用例,可閱讀以下文章:

借助加速以太網網絡和網絡存儲擴展企業 RAG

該聯合解決方案專為處理豐富的圖像和視頻數據、向量數據庫以及大量元數據保存的復雜性而設計。這確保了無縫且高效的 AI 工作流程,使集成變得及時,并成為未來數據驅動創新的關鍵。

提高吞吐量和安全性 降低延遲

此次合作的核心是集成 WEKA 客戶端,并通過使用Virtio-FS 代碼來完成。它直接在 BlueField DPU 上運行,而不是在主機服務器的 CPU 上運行。這種創新方法具有以下關鍵優勢:

提高吞吐量:BlueField 硬件加速功能可實現更快的數據傳輸速率。

降低延遲:通過在 BlueField DPU 上運行 WEKA 客戶端,數據訪問操作可以繞過主機 CPU,從而顯著降低延遲。

CPU 卸載:通過將 WEKA 客戶端遷移到 DPU,可以釋放寶貴的主機 CPU 資源用于應用程序處理,從而有可能提高整體系統性能和效率。

增強安全性:將存儲操作卸載到 DPU 可創建額外的隔離層,從而增強整體系統安全性。

Virtio-FS 代碼的實現有助于主機系統與網絡數據之間的無縫通信,在不犧牲性能的情況下實現高效的文件系統操作。通過在 BlueField DPU 上運行 WEKA 客戶端,可以從 CPU 卸載文件系統任務,從而減少開銷,并釋放高達 20% 的 CPU 資源以用于應用程序。

這種方法還可確保虛擬化環境中的本地文件系統效率和跨平臺兼容性。此外,Virtio-FS 旨在適應不斷發展的 DPU 技術,采用NVIDIA DOCA 軟件框架來簡化未來的開發流程,并兼容新一代 NVIDIA BlueField DPU。

將 Virtio-FS 與 NVIDIA BlueField DPU 結合使用,可將高效、直接的文件共享與強大的卸載和加速功能的優勢結合起來。這種協同作用可提高性能、降低系統復雜性,并支持適合 AI 工作負載的現代可擴展架構。

45e61ea4-cc17-11ef-9310-92fbcf53809c.png

圖 1:在 NVIDIA BlueField-3 DPU 上運行 WEKA 客戶端可提高吞吐量、延遲和安全

硬件加速數據處理

AI 訓練和推理對存儲提出了獨特的挑戰,每個挑戰都有不同的要求。訓練需要高吞吐量來處理大型數據集和寫入密集型操作,而推理需要出色的讀取性能和低延遲來實現實時響應。這兩種情況通常都依賴于共享文件系統。NVIDIA BlueField DPU 通過提供硬件加速數據處理來優化訓練和推理工作負載。

優化 AI 模型訓練

AI 模型訓練對存儲提出了很高的要求,需要快速訪問龐大的數據池來支持 GPU 的生產力。訓練過程包括定期讀取大型數據池,以及頻繁的持續寫入操作,例如記錄日志、保存檢查點和記錄指標。BlueField DPU 提供強大的寫入性能和優化的讀/寫平衡,并有效提供高 IOPS。

適用于推理的低延遲和高讀取性能

AI 推理具有不同的存儲需求,需要快速訪問來自多個來源的少量數據,以保持較低的用戶響應時間。低延遲對于實時或近乎實時的處理至關重要,因為延遲會影響應用程序的響應能力和有效性。推理通常需要使用多個經過訓練的模型和其他數據源來快速做出預測或決策。BlueField DPU 提供快速讀取性能,這對于保持數據流暢運行至關重要,從而為時間敏感型 AI 應用程序提供準確的輸出。

平衡訓練和推理以提高 AI 性能和效率

訓練和推理之間的特定壓力略有不同。平衡這些需求對于構建高效且富有彈性的 AI 存儲架構至關重要,對于創建有效且強大的 AI 存儲解決方案也至關重要。將 WEKA 數據平臺客戶端與 NVIDIA BlueField DPU 集成,可提高訓練和推理工作負載的存儲性能,并提高解決方案的效率和安全性。

總結

在 NVIDIA BlueField DPU 上運行 WEKA 客戶端有助于從 WEKA 文件系統訪問文件,從而充分發揮性能密集型工作負載的潛力,并有利于數據訪問、移動和安全性。

在 SC 2024 大會上,WEKA 和 NVIDIA 通過現場演示展示了集成解決方案的實際優勢。與會者見證了通過提高數據訪問速度和高效工作負載處理來加速 AI 數據處理。我們的專家團隊隨時可為您解答問題,并就此解決方案如何改變您的數據中心運營提供見解。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    40

    文章

    5460

    瀏覽量

    172718
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103717
  • AI
    AI
    +關注

    關注

    87

    文章

    31513

    瀏覽量

    270323
  • DPU
    DPU
    +關注

    關注

    0

    文章

    368

    瀏覽量

    24257

原文標題:NVIDIA BlueField DPU 與 WEKA 客戶端的集成提高了 AI 工作負載的效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用NVIDIA DPF引領DPU加速云計算的未來

    越來越多的企業開始采用加速計算,從而滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 推出了 DOCA 平臺框架(DPF),該框架提供了基礎構建模塊來釋放 NVIDIA BlueField
    的頭像 發表于 01-24 09:29 ?211次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領<b class='flag-5'>DPU</b>加速云計算的未來

    NTP網絡時間服務器能帶同步多少客戶端

    NTP網絡時間服務器能帶同步多少客戶端
    的頭像 發表于 09-04 10:43 ?514次閱讀
    NTP網絡時間服務器能帶同步多少<b class='flag-5'>客戶端</b>?

    esp_iot_sdk_v0.9.6_b1客戶端斷開連接導致WDT重置怎么解決?

    客戶端斷開連接,服務器一定不會掛起。實際上,由于客戶端啟動了連接,因此客戶端理所當然地應該能夠斷開連接,而不會對服務器造成任何問題。 IPD,0,80:GET /測試 HTTP/1.
    發表于 07-18 06:33

    如果ESP的TCP客戶端與服務器斷開連接,如何啟用自動重連?

    ESP - TCP 客戶端 嵌入式 Linux 服務器 - TCP 服務器 如果ESP的TCP客戶端與服務器斷開連接,如何啟用自動重連?
    發表于 07-17 06:25

    如何同時ESP8266運行TCP客戶端和TCP服務?

    客戶端無法連接到 TCP 服務器。如果不將 TCP 客戶端從 ESP 連接到云服務器,則 ESP 的 TCP 服務器可以很好地接受 TCP 客戶端連接。 TCP
    發表于 07-08 08:26

    NVIDIA BlueField-3 DPU助力思科提高工作負載安全性和運營效率

    、位置和外形尺寸的應用程序工作負載。 思科最近發布了Cisco Secure Workload 3.9 版,將企業的安全性和運營效率提升到了新的水平。它提供了新的功能來緩解威脅和漏洞,并為部署微分段(microsegmentation)提供了更大的靈活性。它現在還擴展到NVIDIA
    的頭像 發表于 06-27 17:31 ?829次閱讀

    求助,關于ESP32C3 TCP客戶端連接斷線問題求解

    ESP32C3開啟AP模式做TCP服務器,手機做客戶端連接服務器;超過默認最大連接數(5)以后,即使有部分客戶端斷開了,也無法再發起連接連接不。一定需要服務器給
    發表于 06-27 07:54

    請問esp32能支持多個客戶端同時連接嗎?

    根據我現在的測試結果,esp32作為ble server時同時支持一個客戶端連接,前一個客戶端必須斷開藍牙連接,后一個才能連接。實際esp32能支持多個客戶端同時連接嗎?有沒有相關例程
    發表于 06-11 06:25

    服務測試和客戶端測試區別在哪

    服務測試和客戶端測試是軟件開發過程中的兩個重要環節,它們分別針對服務器客戶端的軟件進行測試。本文將詳細介紹服務測試和
    的頭像 發表于 05-30 15:27 ?3419次閱讀

    借助NVIDIA DOCA 2.7增強AI 云數據中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發者提供了豐富的庫、驅動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創建高性能的應用程序和服務。
    的頭像 發表于 05-29 09:22 ?545次閱讀

    AIROC客戶端控制應用程序不起作用的原因?

    正常,但當啟動客戶端控制應用程序并打開串行端口時,卻什么也沒發生--所有控件都是灰色的。 然后,我還按照說明中的建議從 Windows 10 PC 運行 BTSpy 并進行連接 - 客戶端
    發表于 05-21 06:56

    使用FreeRTOS+LwIP開發版做客戶端斷開后不能夠重新連接?

    請教下, 使用FreeRTOS+LwIP 開發版做客戶端斷開后不能夠重新連接 ? 具體描述如下: 1、開發版作為客戶端使用 2、初次電能夠正常通訊,也就是 開發板可以發送數據到服務器
    發表于 04-30 07:48

    stm32 +lwip1.3.1客戶端異常導致網絡ping不通怎么解決?

    stm32運行lwip作為服務器,如果客戶端異常了,發現在客戶端再也ping不通 網絡如果異常,交換機掛了,重啟后,客戶端怎么都ping
    發表于 04-22 07:30

    HarmonyOS開發實例:【分布式新聞客戶端

    基于柵格布局、設備管理和多端協同,實現一次開發,多端部署的分布式新聞客戶端頁面。
    的頭像 發表于 04-17 15:57 ?929次閱讀
    HarmonyOS開發實例:【分布式新聞<b class='flag-5'>客戶端</b>】

    基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

    作為專為 NVIDIA? BlueField? 網絡平臺而設計的數據中心基礎設施軟件框架,NVIDIA? DOCA? 使廣大開發者能夠利用其行業標準 API
    的頭像 發表于 02-23 10:02 ?536次閱讀
    百家乐官网搏牌| 太阳城官方网站| 大发888网页| 百家乐游戏算牌| 民宅24方位| 百家乐投注方式| 百家乐攻略投注法| 博彩百家乐龙虎| 百家乐官网加牌规| 24山灶位吉凶歌| 百家乐博彩金| 百家乐娱乐平台备用网址| 明溪百家乐的玩法技巧和规则| 蓝盾百家乐赌城| 水果机价格| 连平县| 博九网百家乐官网现金网| 百家乐官网桌子北京| 巴黎人百家乐官网的玩法技巧和规则 | 百家乐有真假宝单吗| 百家乐皇室百家乐| 大发888赢钱最多的| 乐天堂娱乐城| 百家乐官网最佳注码法| 澳门百家乐官网先赢后输| 海王星百家乐官网的玩法技巧和规则| A8百家乐官网娱乐平台| 葡京百家乐玩法| 缅甸百家乐网上投注| 百家乐博彩的玩法技巧和规则| 迷你百家乐的玩法技巧和规则| 百家乐怎么玩| 轮盘赌技巧| 游戏机百家乐官网庄闲| 真人百家乐平台下载| 大发888备用网站| 百家乐官网连黑记录| 百家乐官网预测和局| 大发888是真的吗| 百家乐官网游戏分析| 百家乐官网怎么玩最保险|