吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用FourCastNet進(jìn)行氣候建模

jf_pJlTbmA9 ? 來源:NVIDIA ? 作者:NVIDIA ? 2023-07-05 16:30 ? 次閱讀

NVIDIA Base Command Platform 提供了自信地開發(fā)復(fù)雜軟件的能力,這些軟件符合科學(xué)計(jì)算工作流程所需的性能標(biāo)準(zhǔn)。該平臺(tái)為開發(fā)人員提供高效配置和管理人工智能工作流程所需的工具,從而為人工智能開發(fā)提供云托管和本地解決方案。集成的數(shù)據(jù)和用戶管理簡(jiǎn)化了用戶和管理員的體驗(yàn)。

現(xiàn)在,使用 NVIDIA Modulus 和基本指揮平臺(tái)在團(tuán)隊(duì)和地點(diǎn)之間創(chuàng)建高保真數(shù)字雙胞胎是 high-performance computing ( HPC )工作流可用的最新工具。對(duì)于從預(yù)測(cè)最優(yōu) airplane maintenance schedules 到 simulating wind farms 的許多用例來說,創(chuàng)建和使用數(shù)字雙胞胎對(duì)于節(jié)省時(shí)間和金錢至關(guān)重要。

開始使用這些用例可能會(huì)讓人望而卻步。然而,一個(gè)集成良好的解決方案會(huì)帶來所有的不同,并使開發(fā)人員能夠?qū)W⒂诮鉀Q問題。 Base Command Platform 只需點(diǎn)擊幾下即可實(shí)現(xiàn) NGC 目錄軟件的全方位功能,并能夠創(chuàng)建強(qiáng)大的物理知情機(jī)器學(xué)習(xí)( physics ML )神經(jīng)網(wǎng)絡(luò)和氣候模型。

利用 FourCastNet 進(jìn)行氣候建模

FourCastNet 是開源 Modulus 平臺(tái)的一部分,專注于以以前不可能的速度創(chuàng)建全球天氣預(yù)報(bào)。它依靠傅立葉神經(jīng)算子和變換器在性能和分辨率上實(shí)現(xiàn)了這一令人難以置信的飛躍。 FourCastNet 現(xiàn)在與基本命令平臺(tái)兼容。

ERA5 dataset 是一個(gè)幾十年來整個(gè)地球的復(fù)雜天氣數(shù)據(jù)集,用于訓(xùn)練和驗(yàn)證這樣一個(gè)復(fù)雜的模型。 FourCastNet 是實(shí)現(xiàn) NVIDIA Earth-2 數(shù)字孿生的關(guān)鍵技術(shù)。有關(guān)更多信息,請(qǐng)參閱 NVIDIA to Build Earth-2 Supercomputer to See Our Future 。

Modulus 團(tuán)隊(duì)一直在尋求提高 FourCastNet 的性能,最近更新了它,使用 NVIDIA Data Loading Library ( DALI )將數(shù)據(jù)攝入 GPU ,進(jìn)一步加快了洞察時(shí)間。

在基本指揮平臺(tái)上使用 Modulus 提高可擴(kuò)展性

當(dāng)在一個(gè)可以擴(kuò)展到幾個(gè)基于 GPU 的系統(tǒng)的環(huán)境中運(yùn)行時(shí), Modulus 的全部功能就會(huì)釋放出來。沒有比基本命令平臺(tái)更好的方法來運(yùn)行像 Modulus 這樣的高度可擴(kuò)展平臺(tái)來訓(xùn)練像 FourCastNet 這樣的大型模型。

為了運(yùn)行這些示例,我們將稍微修改過的 Modulus NGC container 版本上傳到了一個(gè)基本指揮平臺(tái)組織,該組織可以訪問由 NVIDIA DGX A100 系統(tǒng)組成的加速計(jì)算環(huán)境。我們將 1TB 的 ERA5 數(shù)據(jù)集上傳到同一環(huán)境中的工作空間。

為了支持協(xié)調(diào)的多實(shí)例工作負(fù)載, Base Command Platform 集成了一個(gè)名為 bcprun 的工具。bcprun通過抽象機(jī)器學(xué)習(xí)( ML )從業(yè)者的復(fù)雜性并消除工作負(fù)載容器(如mpirun)中對(duì)額外軟件的需求,簡(jiǎn)化了多實(shí)例工作負(fù)載部署。它還為最初為 HPC 調(diào)度器(如 Slurm )編寫的應(yīng)用程序提供了一個(gè)更容易的入門路徑。

以下代碼示例顯示了 FourCastNet 在 Base Command Platform 上的單實(shí)例作業(yè)啟動(dòng):

ngc batch run 
--name "bcp-dali.fcn.training.ml-model.modulus" 
--total-runtime 12H 
--org org-name 
--ace ace-name 
--instance dgxa100.80g.8.norm 
--workspace ERA5_test_21Vars:/era5/ngc_era5_data/:RO 
--result /results 
--image "nvcr.io/org-name/team-name/modulus:22.09-examples_0.4" 
--commandline "
set -x && 
cd /examples/fourcastnet/ && 
ln -s /era5/stats . && 
python fcn_era5.py 
custom.train_dataset.kind=dali 
custom.num_workers.grid=1 
training.max_steps=50000 
training.print_stats_freq=500 
network_dir=/results/network_checkpoint
"

要擴(kuò)展到兩個(gè) NVIDIA DGX A100 八個(gè) GPU 實(shí)例(共 16 個(gè)),請(qǐng)使用以下命令(在 bold 中突出顯示更改):

ngc batch run 
--name "bcp-dali.fcn.training.ml-model.modulus" 
--total-runtime 12H 
--org org-name 
--ace ace-name 
--replicas "2" 
--array-type "PYTORCH" 
--instance dgxa100.80g.8.norm 
--workspace ERA5_test_21Vars:/era5/ngc_era5_data/:RO 
--result /results 
--image "nvcr.io/org-name/team-name/modulus:22.09-examples_0.4" 
--commandline "
set -x && 
cd /examples/fourcastnet/ && 
mkdir -p /results/network_checkpoint && 
ln -s /era5/stats . && 
bcprun --nnodes $NGC_ARRAY_SIZE 
--npernode $NGC_GPUS_PER_NODE 
--cmd '
python fcn_era5.py 
custom.train_dataset.kind=dali 
custom.num_workers.grid=1 
training.max_steps=50000 
training.print_stats_freq=500 
network_dir=/results/network_checkpoint
'
"

bcprun的添加以及添加的參數(shù)確保指定的命令(來自--cmd參數(shù))在為作業(yè)創(chuàng)建的每個(gè)副本上運(yùn)行(如--replicas和--nnodes參數(shù)所指定)。--npernode參數(shù)確保在每個(gè)實(shí)例上為該實(shí)例中的每個(gè) GPU 運(yùn)行一個(gè)進(jìn)程。這導(dǎo)致此作業(yè)總共啟動(dòng)了 16 個(gè)進(jìn)程(每個(gè)復(fù)制副本中有 8 個(gè),總共兩個(gè)復(fù)制副本)。要擴(kuò)展到使用四個(gè)實(shí)例,請(qǐng)將--replicas參數(shù)設(shè)置為四個(gè)而不是兩個(gè)。

基本命令平臺(tái)不僅為 ML 從業(yè)者和管理員提供了易用性,而且證明了已經(jīng)實(shí)現(xiàn)了最高性能。 NVIDIA Selene supercomputer 與 Modulus 運(yùn)行 FourCastNet 訓(xùn)練進(jìn)行比較。

在 Selene 上測(cè)試了工作負(fù)載后,我們?cè)诨局笓]平臺(tái)部署上無縫復(fù)制了工作負(fù)載,并在兩個(gè)環(huán)境之間獲得了幾乎相同的結(jié)果。這一結(jié)果有力地證明,基本指揮平臺(tái)可以支持企業(yè)和科學(xué)計(jì)算用例中客戶最苛刻的性能要求。

modulus-fourcastnet-performance-comparison.png 圖 2 :在不同 GPU 數(shù)量下, NVIDIA Selene 超級(jí)計(jì)算機(jī)和基本命令平臺(tái)部署之間的 Modulus FourCastNet 性能比較(在 GPU 數(shù)量上同時(shí)進(jìn)行更好)

對(duì)開發(fā)者 Kaustubh Tangsali 的采訪

為了了解更多關(guān)于在 Base Command Platform 上使用 NVIDIA Modulus 的經(jīng)驗(yàn),我們采訪了 Modulus 團(tuán)隊(duì)的開發(fā)人員 Kaustubh Tangsali 。 Kaustubh 領(lǐng)導(dǎo)了在基本指揮平臺(tái)上運(yùn)行 FourCastNet 和其他幾個(gè)軟件示例的調(diào)查。

簡(jiǎn)要描述您的行業(yè)背景和經(jīng)驗(yàn)。

我主要在軟件行業(yè)工作,應(yīng)用于模擬和計(jì)算流體動(dòng)力學(xué)。我致力于 Modulus 平臺(tái)的開發(fā),這是一個(gè)領(lǐng)域?qū)<液腿斯ぶ悄軓臉I(yè)者開發(fā)物理 ML 模型的框架。我曾與 NVIDIA Thermal 團(tuán)隊(duì)等內(nèi)部合作伙伴密切合作,使用 Modulus 設(shè)計(jì)散熱器,還與幾個(gè)外部合作伙伴合作,使用 Modulus 加快工作流程。

您在基礎(chǔ)指揮平臺(tái)上使用 Modulus 工作了多長時(shí)間?

自 2020 年年中以來,我一直在基地指揮平臺(tái)上使用 Modulus 。

在基地指揮平臺(tái)上,日常使用是什么樣子的?您的開發(fā)周期是什么樣子的?

在我對(duì)代碼或模型進(jìn)行了一些本地測(cè)試后,我通常會(huì)將代碼安裝在基本命令平臺(tái)工作區(qū)中,然后使用 NGC web 界面或僅使用命令行界面( CLI )啟動(dòng)作業(yè)。 Jupyter 接口非常適合早期調(diào)試。當(dāng)模型運(yùn)行到完成時(shí),我下載檢查點(diǎn)和結(jié)果以進(jìn)行進(jìn)一步分析。在運(yùn)行時(shí),我還使用日志功能和遙測(cè)技術(shù)來監(jiān)視作業(yè)的狀態(tài)。

基本指揮平臺(tái)環(huán)境與您使用過的其他環(huán)境相比如何?

基本指揮平臺(tái)的 web 界面是我覺得有用的東西。監(jiān)視作業(yè)、查看用于啟動(dòng)作業(yè)的命令、克隆作業(yè)以及使用不同的實(shí)例類型等功能都很容易。我認(rèn)為獲得最新和最好的 NVIDIA 硬件是一大優(yōu)勢(shì)。

對(duì)于剛開始使用基地指揮平臺(tái)的人,你有什么建議嗎?

NVIDIA Base Command Platform User Guide 有很好的文檔記錄,涵蓋了數(shù)據(jù)科學(xué)家可能遇到的許多常見用例,包括單 GPU 、多[Z1K1’和多實(shí)例作業(yè)的命令示例。正如我前面提到的,在擴(kuò)展作業(yè)之前,我喜歡在開發(fā)的早期階段利用運(yùn)行作業(yè)的交互式特性,CLI會(huì)對(duì)其進(jìn)行優(yōu)化。

總結(jié)

NVIDIA Modulus 等尖端數(shù)字孿生技術(shù)依靠強(qiáng)大的計(jì)算環(huán)境不斷進(jìn)步?;局笓]平臺(tái)在一組易于使用的界面中利用 NVIDIA GPU 的強(qiáng)大功能,繼續(xù) NVIDIA 的使命,即讓高級(jí)軟件功能廣泛可訪問,以解決重要問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103728
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31536

    瀏覽量

    270344
  • Base
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    8732
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Saber軟件功率MOSFET自建模與仿真驗(yàn)證

    Architect工具可對(duì)變壓器、功率MOSFET、功率二極管、傳輸電纜等進(jìn)行定制建模,而且建模信息主要利用器件手冊(cè)和器件實(shí)驗(yàn)數(shù)據(jù);因而定制設(shè)計(jì)的器件模型較為精確,較為真實(shí)反映器件的
    發(fā)表于 04-12 20:43

    淺析Python建模

    利用Python進(jìn)行數(shù)據(jù)分析》 131pandas與建模代碼的結(jié)合
    發(fā)表于 10-22 06:08

    如何使用Patsy創(chuàng)建模型描述?

    利用Python進(jìn)行數(shù)據(jù)分析》132 使用Patsy創(chuàng)建模型描述
    發(fā)表于 07-14 07:50

    利用Matlab的simulink搭建模型生成C代碼

    一、整體思路利用Matlab的simulink搭建模型生成C代碼,通過stm32cubemx生成工程,最后在KEIL或者IAR等工具里面編譯生成代碼下載至MCU中執(zhí)行。本文以流水燈建立模型和簡(jiǎn)單
    發(fā)表于 08-04 06:08

    利用Matlab的simulink搭建模型生成C代碼

    一、整體思路利用Matlab的simulink搭建模型生成C代碼,通過stm32cubemx生成工程,最后在KEIL或者IAR等工具里面編譯生成代碼下載至MCU中執(zhí)行。本文以流水燈建立模型和簡(jiǎn)單
    發(fā)表于 08-10 07:49

    對(duì)電動(dòng)機(jī)幾種降壓?jiǎn)?dòng)進(jìn)行建模及仿真分析

    1引言Matlab是一種高性能的數(shù)值計(jì)算機(jī)和可視化功能的軟件??梢?b class='flag-5'>利用Matlab中Simulink的可視化仿真工具,將電動(dòng)機(jī)控制利用模塊連接起來,構(gòu)成復(fù)雜的系統(tǒng)模型,并進(jìn)行仿真和分析[1]。本文將
    發(fā)表于 09-06 06:19

    基于PSO和SVM的發(fā)酵過程建模與優(yōu)化控制

    針對(duì)微生物發(fā)酵過程的建模與優(yōu)化控制問題,利用支持向量機(jī)理論進(jìn)行發(fā)酵過程的建模,并提出采用粒子群優(yōu)化算法對(duì)支持向量機(jī)建模過程中的重要參數(shù)
    發(fā)表于 08-31 11:43 ?6次下載

    如何利用ADIsimPLL對(duì)壓控振蕩器模型進(jìn)行建模并仿真

    本視頻短片介紹如何利用ADIsimPLL對(duì)壓控振蕩器(VCO)模型進(jìn)行建模并仿真。ADIsimPLL設(shè)計(jì)工具是一款全面且簡(jiǎn)單易用的PLL頻率合成器設(shè)計(jì)和仿真工具。
    的頭像 發(fā)表于 06-26 06:11 ?4676次閱讀
    如何<b class='flag-5'>利用</b>ADIsimPLL對(duì)壓控振蕩器模型<b class='flag-5'>進(jìn)行</b><b class='flag-5'>建模</b>并仿真

    基于多種模型的云南農(nóng)作物區(qū)域氣候分析

    針對(duì)日前云南省缺乏農(nóng)作物種植與氣候指標(biāo)預(yù)測(cè)模型與建模方法的問題,首先,概述了降水量、溫度、空氣濕度等主要氣候因素的數(shù)據(jù)分析預(yù)測(cè)模型的研究現(xiàn)狀,分析溫度、降雨量、濕度與農(nóng)業(yè)氣候資源的綜合
    發(fā)表于 04-28 14:55 ?2次下載
    基于多種模型的云南農(nóng)作物區(qū)域<b class='flag-5'>氣候</b>分析

    利用HFSS軟件進(jìn)行3D可視化建模

    摘要: HFSS作為高頻結(jié)構(gòu)設(shè)計(jì)的首選工具和行業(yè)標(biāo)準(zhǔn),能從幾何結(jié)構(gòu)、材料特性到分析、控制及所有后處理進(jìn)行全參量化設(shè)計(jì)??蓪?duì)于仿真設(shè)計(jì)相關(guān)的工程師來說,利用HFSS軟件進(jìn)行3D可視化建模
    的頭像 發(fā)表于 05-10 11:14 ?5576次閱讀
    <b class='flag-5'>利用</b>HFSS軟件<b class='flag-5'>進(jìn)行</b>3D可視化<b class='flag-5'>建模</b>

    用MATLAB進(jìn)行曲面建模

    用MATLAB進(jìn)行曲面建模方法說明。
    發(fā)表于 05-27 09:41 ?0次下載

    人工氣候室的作用及功能

    人工氣候室是由托普云農(nóng)研發(fā)供應(yīng),它是進(jìn)行各類生物氣候實(shí)驗(yàn)的專用儀器,其中能夠充分利用自然資源,并在此基礎(chǔ)上,綜合運(yùn)用生物科學(xué)、信息科學(xué)、管理科學(xué)和控制科學(xué)等相關(guān)學(xué)科知識(shí),實(shí)現(xiàn)人工控制管
    發(fā)表于 06-16 14:49 ?1191次閱讀

    如何利用工具模板快速對(duì)TSV陣列進(jìn)行建模

    本文介紹了采用芯和半導(dǎo)體ViaExpert軟件進(jìn)行TSV陣列的建模和仿真分析流程。TSV結(jié)構(gòu)復(fù)雜,存在建模繁瑣、分析不便等問題。
    的頭像 發(fā)表于 06-03 09:03 ?1913次閱讀
    如何<b class='flag-5'>利用</b>工具模板快速對(duì)TSV陣列<b class='flag-5'>進(jìn)行</b><b class='flag-5'>建模</b>

    利用CFD建模方法進(jìn)行PCB熱設(shè)計(jì)

    Icepak是一種熱建模的軟件工具,可以用于研究電路板中熱導(dǎo)率的局部變化。除了計(jì)算流體動(dòng)力學(xué)(CFD)功能外,該軟件工具還把電路板的走線和過孔情況考慮進(jìn)去,進(jìn)而計(jì)算整個(gè)電路板上的熱導(dǎo)率分布。這個(gè)特性使得Icepak非常適用于以下研究工作。
    發(fā)表于 08-22 14:20 ?596次閱讀

    cad如何進(jìn)行三維建模

    三維建模是計(jì)算機(jī)輔助設(shè)計(jì)(CAD)中的一項(xiàng)重要技術(shù),它可以幫助設(shè)計(jì)師在計(jì)算機(jī)上創(chuàng)建和編輯三維模型。本文將介紹如何使用CAD軟件進(jìn)行三維建模,包括建模的基本步驟、
    的頭像 發(fā)表于 07-09 10:23 ?1194次閱讀
    百家乐分析博彩正网| 致胜百家乐软件| 网上百家乐内| 海王星线上娱乐| 订做百家乐官网桌子| 彩会百家乐游戏| 大发888娱乐注册| 百家乐官网优惠高的网址| 百家乐稳赚秘籍| 百家乐官方网站| 百家乐官网庄闲出现几率| 百家乐真人投注网站| 大发888娱乐城在线客服| 百家乐官网博彩软件| 澳门百家乐海星王娱乐城| 娱乐城注册送58| 红桃K百家乐官网的玩法技巧和规则| 百博百家乐的玩法技巧和规则| tt线上娱乐| 永利百家乐官网赌场娱乐网规则 | BB百家乐HD| 呈贡县| 杨公先师24山秘密全书| 大发888二十一点| 视频百家乐官网游戏| 上海百家乐的玩法技巧和规则 | 大发百家乐官网的玩法技巧和规则 | 多多视频棋牌游戏| 百家乐官网游戏厅| 威尼斯人娱乐城可信吗| 澳门百家乐官网的公式| 澳门百家乐必赢技巧| 百家乐官网视频连线| 太阳城百家乐公司| 博狗百家乐官网开户| 金鼎百家乐局部算牌法| 百家乐官网最新心得| 百家乐赌博牌路分析| 百家乐官网单跳投注法| 郑州百家乐的玩法技巧和规则| 奉节县|