吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-09-09 09:57 ? 次閱讀

DolphinDB 是一家高性能數據庫研發企業,也是 NVIDIA 初創加速計劃成員,其開發的產品基于高性能分布式時序數據庫,是支持復雜計算和流數據分析的實時計算平臺,適用于金融、電力、物聯網和零售等行業。

DolphinDB 公司推出的 CPU-GPU 異構計算平臺 Shark,將 DolphinDB 上的復雜指標計算能力無縫切換到 GPU 算力平臺,從而大幅提升了計算性能。

DolphinDB 開發團隊與 NVIDIA 團隊合作,通過利用NVIDIA RAPIDS加速 Shark 異構計算平臺的因子挖掘算法運行效率,幫助 Shark 將因子挖掘的效率提升 2 - 10 倍,并基于NVIDIA cuDF實現 Shark 因子高效計算,大幅減少開發成本,縮短開發周期。

RAPIDS 的 RMM 是一套開源的內存/顯存管理庫,提供 C++Python 接口,相比 cuMalloc、cuFree 等操作來講,具有更好的性能和靈活性;RAPIDS libcudf 是基于 GPU 的 C++ DataFrame 庫,提供了基礎數據結構,并且內置了基礎的函數算子。

Shark 的因子挖掘功能,能通過利用遺傳算法從數據中挖掘出有效的因子。在這一場景中,遺傳算法會隨機生成大量因子并進行計算。這一過程會頻繁地創建和釋放臨時空間來存儲中間結果,直接使用原生的 CUDA C 顯存分配和釋放接口,會嚴重降低執行效率。

Shark 的因子計算功能,針對金融領域的數據分析與處理,提供了豐富的函數庫。如果從零開始將 CPU 的函數遷移至 GPU,需要為 GPU 重新實現一套底層數據結構以及基礎計算函數,會導致開發周期的延長以及開發成本的增加。

基于以上挑戰,DolphinDB 開發團隊與 NVIDIA 團隊及 RAPIDS 開發團隊合作,通過利用 RAPIDS RMM,解決因子挖掘過程中頻繁申請和釋放顯存導致的性能問題;通過基于 RAPIDS libcudf 進行二次開發,實現因子計算,從而縮短開發周期,降低開發成本。

Shark 進行因子挖掘時,會通過遺傳算法隨機生成海量的因子計算公式。這些公式長度不等,接受的參數數量也不盡相同。因此在計算時,需要頻繁地申請和釋放臨時空間用于存儲中間結果。DolphinDB 開發團隊通過使用 RMM 對顯存進行池化,從而對中間結果所使用的顯存進行高效地分配、釋放和重用。

Shark 支持用戶輸入自定義的公式,自動將自定義公式轉換為計算圖,并在 GPU 完成計算,從而加快數據分析和處理的效率。如果從零開始將 DolphinDB 的計算函數遷移至 Shark,則需要在 GPU 構建 array、table 等底層數據結構,并實現大量基礎計算函數。經過調研后,DolphinDB 開發團隊決定基于 RAPIDS libcudf 進行二次開發,復用 cuDF 的 column、table 等底層數據結構,并借助 cuDF 的 groupby 和 rolling 框架,只需要完成算子的核心計算邏輯,即可完成 DolphinDB 時序算子和橫截面算子的遷移,這樣不僅極大提升了開發效率,還降低了開發成本。

下圖展示了在不同規模數據下,使用 RAPIDS 的 RMM 顯存管理庫相對于原生的 CUDA 顯存分配 API,Shark 因子挖掘效率的對比??梢郧宄乜吹?,使用 RMM 可以顯著提升 Shark 因子挖掘效率,最高可達到 10 倍的加速比。

50de12f3c871da8be6a7494a93111a82.png

除此之外,Shark 通過使用 RAPIDS libcudf,大大提升了因子的計算效率。下圖中對比了 1000 個 group,每個 group 有 10 萬行的數據,采用分組方式計算下面的算子??梢钥吹脚c CPU 相比,利用 GPU 總體耗時(包含拷貝時間),基本達到了一個數量級的加速比。

75c03a398e3c2fe4ee975f744d834f86.png

借助 RAPIDS ,Shark 的因子挖掘效率提升了 10 倍。除此之外,基于 cuDF 進行二次開發,只需要實現算子的核心邏輯,就可以達到一個數量級的加速,并極大降低了算子遷移成本。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103719
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4774

    瀏覽量

    129351
  • 數據庫
    +關注

    關注

    7

    文章

    3846

    瀏覽量

    64685

原文標題:NVIDIA RAPIDS 助力 Shark 平臺實現高效數據挖掘和計算

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用NVIDIA DPF引領DPU加速計算的未來

    越來越多的企業開始采用加速計算,從而滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 推出了 DOCA 平臺框架(DPF),該框架提供了基礎構建模塊來釋放
    的頭像 發表于 01-24 09:29 ?211次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> DPF引領DPU<b class='flag-5'>加速</b>云<b class='flag-5'>計算</b>的未來

    NVIDIA助力FinCatch開發智能投資輔助系統

    本案例中通過 NVIDIA GPU 和 RAPIDS 加速平臺,FinCatch 實現了投資研究流程的全面智能化,提升數據分析速度和準確性,
    的頭像 發表于 01-07 09:23 ?220次閱讀

    借助NVIDIA GPU提升魯班系統CAE軟件計算效率

    本案例中魯班系統高性能 CAE 軟件利用 NVIDIA性能 GPU,實現復雜產品的快速仿真,加速產品開發和設計迭代,縮短開發周期,
    的頭像 發表于 12-27 16:24 ?233次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    問題,但會降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計算需要啟用,可通過命令行
    發表于 12-16 14:25

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴展了 Meta Llama 開源模型集的模型陣容,包含視覺語言模型(VLM)、小語言模型(SLM)和支持視覺的更新版 Llama Guard 模型。與 NVIDIA 加速
    的頭像 發表于 11-20 09:59 ?310次閱讀

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發表于 11-20 09:52 ?295次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    NVIDIA加速計算如何推動醫療健康

    近日,NVIDIA 企業平臺副總裁 Bob Pette 在 AI Summit 一場演講中重點談論了 NVIDIA 加速計算如何推動醫療健康
    的頭像 發表于 11-20 09:10 ?354次閱讀

    NVIDIA向開放計算項目捐贈Blackwell平臺設計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎元素捐贈
    的頭像 發表于 11-19 15:30 ?262次閱讀

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術發展的基石,更是推動AI應用落地、加速產業升級的重要工具。以下,是對AI高性能
    的頭像 發表于 11-11 09:56 ?276次閱讀

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學
    的頭像 發表于 10-25 09:23 ?292次閱讀

    以實時,見未來——DolphinDB 2024 年度峰會圓滿舉辦

    DolphinDB 還圍繞投研、交易、FICC、數據分析、計算平臺、AI 前沿等熱門場景,精心設置了六大路演展臺。DolphinDB 技術工程師現場演示了諸多新功能的應用 Demo,與
    的頭像 發表于 09-10 14:14 ?321次閱讀
    以實時,見未來——<b class='flag-5'>DolphinDB</b> 2024 年度峰會圓滿舉辦

    NVIDIA Blackwell平臺推動科學計算突破發展

    最新加速器和網絡平臺提升高級模擬、AI、量子計算、數據分析等方面的性能。
    的頭像 發表于 05-15 09:45 ?445次閱讀

    NVIDIA通過CUDA-Q平臺為全球各地的量子計算中心提供加速

    德國、日本和波蘭的超級計算利用 Grace-Hopper 和量子-經典加速超算平臺推進量子計算研究。
    的頭像 發表于 05-14 09:15 ?405次閱讀

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

    德國、日本和波蘭的超級計算利用 Grace-Hopper 和量子-經典加速超算平臺推進量子計算研究 ? ? 德國漢堡 —— 國際超算大會(
    發表于 05-13 15:21 ?226次閱讀
    <b class='flag-5'>NVIDIA</b> 通過 CUDA-Q <b class='flag-5'>平臺</b>為全球各地的量子<b class='flag-5'>計算</b>中心提供<b class='flag-5'>加速</b>

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱
    的頭像 發表于 04-20 09:39 ?822次閱讀
    7人百家乐桌布| 24山风水真龙图| 网上的百家乐官网怎么才能赚钱| 大发888游戏平台188| 新奥博娱乐城体育投注| 抚顺棋牌网| 合山市| 百家乐官网注码法| 聚宝盆百家乐官网的玩法技巧和规则| 百家乐真人游戏网| 韩国百家乐的玩法技巧和规则| 谈大发888风水和运气| 盐池县| 百家乐官网在线赌场娱乐网规则| 云鼎娱乐城优惠| 真人百家乐官网什么平台| 百家乐官网第三张规则| 战神百家乐的玩法技巧和规则| 皇冠足球即时比分| 足球百家乐官网投注计算| 海立方百家乐赢钱| 网上娱乐城注册送彩金| 财神百家乐官网娱乐城| 百家乐官网送钱平台| V博百家乐的玩法技巧和规则| 真钱轮盘游戏| 重庆百家乐官网团购百嘉乐量贩KTV地址| 百家乐庄闲多少| 大发888娱乐场下载客户端| 波音网百家乐官网合作| 百家乐ipone| 亚洲顶级赌场手机版| 网络百家乐官网软件真假| 百家乐赌缆注码运用| 棋牌58w| 百家乐官网赌博策略论坛| 月华百家乐官网的玩法技巧和规则| 博天堂百家乐的玩法技巧和规则 | 永利百家乐娱乐网| 镇原县| 百家乐体育宝贝|