吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Merlin HugeCTRV 3.8/3.9版本新增內(nèi)容

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-24 10:12 ? 次閱讀

Merlin HugeCTR(以下簡(jiǎn)稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個(gè) GPU 和節(jié)點(diǎn)之間分配訓(xùn)練并估計(jì)點(diǎn)擊率(Click-through rate)。

V3.8 版本新增內(nèi)容

1. 第三代 Embedding 的示例:

這個(gè)版本我們新增了一個(gè)示例筆記本,介紹了 Embedding 集合的 Python API 以及第三代 Embedding 的使用方法。

2. 用于分級(jí)參數(shù)服務(wù)器查找功能的 DLPack Python API:

這個(gè)版本我們引入了對(duì)使用 DLPack Python API 從分層參數(shù)服務(wù)器 (HPS) 查找 Embedding 的支持。新方法是 lookup_fromdlpack()。

3. 使用 Python API 從 HDFS 讀取 Parquet 數(shù)據(jù)集:

現(xiàn)在您可以通過 DataSourceParams 來指定 Data Reader 的數(shù)據(jù)源的配置了,例如 Hadoop 分布式文件系統(tǒng)的 NameNode 的主機(jī)名和 NameNode 端口號(hào)。

4. 提高了日志記錄的性能。

5. 層類的改進(jìn):

全連接層現(xiàn)已支持 3 維輸入,Matrix Multiply 層現(xiàn)已支持 4 維輸入。

6. 文檔的改進(jìn):

a. 增加了導(dǎo)航長(zhǎng)頁(yè)面以提供更好的體驗(yàn)。

b. Criteo 1TB 點(diǎn)擊日志數(shù)據(jù)集的 URL 已更新。

7. 修復(fù)的問題:

修復(fù)了 _metadata.json 配置文件內(nèi)的文件名和實(shí)際數(shù)據(jù)集文件名不一致的問題。

修復(fù)了在 AUC 預(yù)熱期間在多個(gè) GPU 上運(yùn)行大型模型時(shí)發(fā)生的內(nèi)存崩潰問題。

修復(fù)了 ETC 筆記本中鍵集生成的問題。

修復(fù)了使用調(diào)試模式編譯時(shí)發(fā)生的編譯錯(cuò)誤。

修復(fù)多節(jié)點(diǎn)訓(xùn)練出現(xiàn)重復(fù)日志的問題。

V3.9 版本新增內(nèi)容

1. 第三代 Embedding 的更新:

更新了 SOK 以使用 HugeCTR 第三代 Embedding 作為開發(fā)者預(yù)覽版本。

啟用了基于 cuCollection的動(dòng)態(tài)Embedding 模式。動(dòng)態(tài)的Embedding能夠在用戶不配置內(nèi)存使用信息時(shí)自動(dòng)拓展。

2. 全新的多節(jié)點(diǎn)訓(xùn)練教程

我們提供了一個(gè)全新的基于 HugeCTR 最新 Docker 容器使用多節(jié)點(diǎn)訓(xùn)練的實(shí)例。

3. 現(xiàn)已支持 MMoE 模型的離線推理并提供了 Per-class AUC 和平均 AUC 計(jì)算。

4. 對(duì) HPS TensorFlow 插件使用的文檔和實(shí)例更新:

一個(gè)新的簡(jiǎn)介文檔。

新的實(shí)例筆記本。

新的API文檔。

5. 修復(fù)的問題:

修復(fù)了一個(gè)訓(xùn)練性能受到 GPU 例程檢查影響的問題。該例程檢查輸入的 key 是否在規(guī)定的 Embedding Table 范圍內(nèi)。對(duì)于可以保證輸入的 key 能放在指定的 workspace_size_per_gpu_in_mb 的情況,我們提供了一種解決方法:通過設(shè)置環(huán)境變量 HUGECTR_DISABLE_OVERFLOW_CHECK=1 來關(guān)閉例程檢查,以便恢復(fù)訓(xùn)練性能。

我們修復(fù)了一個(gè) Softmax 層的正確性問題。

我們刪除了一個(gè)未更新且不再使用的內(nèi)聯(lián)分析器。

已知問題

以下是目前HugeCTR存在的已知問題,我們將在之后的版本中盡快修復(fù)。

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁(yè)面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時(shí),建議您通過發(fā)出以下命令來增加這些資源 -shm-size=1g -ulimit memlock=-1

另見 NCCL 的 已知問題。

還有 GitHub 問題。

目前即使目標(biāo) Kafka broker 無響應(yīng),KafkaProducers 啟動(dòng)也會(huì)成功。為了避免與來自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動(dòng)、正常工作并且可以從運(yùn)行 HugeCTR 的節(jié)點(diǎn)訪問。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 data reader worker 將被映射到同一個(gè)文件,導(dǎo)致數(shù)據(jù)加載不會(huì)按預(yù)期進(jìn)行。

正則化器暫時(shí)不支持聯(lián)合損失訓(xùn)練。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4775

    瀏覽量

    129357
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4807

    瀏覽量

    85038
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    473

    瀏覽量

    16564

原文標(biāo)題:HugeCTR v3.8 & v3.9 發(fā)布說明

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    motorBench 2.45.0版本說明

    電子發(fā)燒友網(wǎng)站提供《motorBench 2.45.0版本說明.pdf》資料免費(fèi)下載
    發(fā)表于 01-22 16:15 ?0次下載
    motorBench 2.45.0<b class='flag-5'>版本</b>說明

    HDMI Forum發(fā)布HDMI規(guī)范2.2版本

    邁出了重要一步。 HDMI規(guī)范2.2版本內(nèi)容制作商,如電視、電影和游戲工作室等,提供了更高質(zhì)量的選擇。無論是當(dāng)前還是未來,這一新技術(shù)都能滿足內(nèi)容制作商對(duì)于高清畫質(zhì)和高效傳輸?shù)男枨?。同時(shí),它還能實(shí)現(xiàn)多種分發(fā)平臺(tái),為用戶提供更加豐
    的頭像 發(fā)表于 01-10 14:07 ?181次閱讀

    OurBMC 24.12版本正式上線

    日前,經(jīng)過社區(qū)開發(fā)者的共同努力,OurBMC 全新升級(jí),24.12版本正式上線。
    的頭像 發(fā)表于 01-07 13:45 ?184次閱讀

    淺談Xpedition 2409版本的新功能

    在《創(chuàng)新不止|Xpedition 2409版本新功能揭秘(上)》一文中,我們了解了Xpedition 2409版本的部分改進(jìn)部分。今天,我們繼續(xù)看Xpedition 2409新版本給我們帶來了什么樣的全新用戶體驗(yàn)。
    的頭像 發(fā)表于 10-31 15:33 ?1334次閱讀

    Percepio Tracealyzer 4.9版本改善Linux用戶體驗(yàn)

    嵌入式邊緣系統(tǒng)工具解決方案的領(lǐng)先供應(yīng)商Percepio AB宣布提供Tracealyzer4.9版本——這是其嵌入式軟件旗艦可觀察性工具的最新更新。
    的頭像 發(fā)表于 10-22 14:08 ?400次閱讀

    實(shí)時(shí)網(wǎng)絡(luò)的仿真和配置工具RTaW Pegase v4.6版本更新

    RTaW-Pegasev4.6版本的主要更新內(nèi)容,涵蓋了DDS、SOME/IP、Ethernet、CAN以及SDV等多個(gè)關(guān)鍵領(lǐng)域的改進(jìn)。無論您是汽車電子、航空航天還是工業(yè)自動(dòng)化領(lǐng)域的專業(yè)
    的頭像 發(fā)表于 09-26 08:07 ?302次閱讀
    實(shí)時(shí)網(wǎng)絡(luò)的仿真和配置工具RTaW Pegase v4.6<b class='flag-5'>版本</b>更新

    USB4 2.0版本的重大更新

    USB版本一直很多,可以說是五花八門,但是隨著接口的日漸統(tǒng)一,USB的版本可以說減少了很多,到了USB4,只剩下USB-C接口,為何還有一個(gè)2.0版本,我們往下詳解。
    的頭像 發(fā)表于 09-09 14:37 ?715次閱讀

    微軟發(fā)布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發(fā)布了智能辦公工具 OfficePLUS V 3.0 版本。全新升級(jí)的 OfficePLUS V 3.0 新增了 Excel 插件,繼已發(fā)布的 PPT/Word 插件之后, 完成了對(duì) Office 核心使用場(chǎng)景的全方位覆蓋,讓用戶擁有更加輕松的創(chuàng)作體驗(yàn)。
    的頭像 發(fā)表于 06-27 09:26 ?822次閱讀

    ENV-Windows v2.0.0版本發(fā)布

    ENV-Windows v2.0.0版本發(fā)布
    的頭像 發(fā)表于 06-26 08:35 ?872次閱讀
    ENV-Windows v2.0.0<b class='flag-5'>版本</b>發(fā)布

    微軟Edge瀏覽器新增睡眠模式標(biāo)簽頁(yè)自動(dòng)舍棄策略

    據(jù)悉,微軟近期面向測(cè)試版平臺(tái)推送了Edge 125版本更新,新增加“AutoDiscardSleepingTabsEnabled”功能,即自動(dòng)清除開啟休眠模式超過1.5天的標(biāo)簽頁(yè)。
    的頭像 發(fā)表于 05-08 11:52 ?591次閱讀

    LwIP v2.0版本更換為v2.1.2版本后接收不到數(shù)據(jù)了怎么解決?

    請(qǐng)教下,吧 LwIP v2.0 版本更換為 v2.1.2 版本后接收不到數(shù)據(jù)了,是怎么回事啊 ?? 之前使用 v2.0 版本測(cè)試是完全可以了,不過目前 使用 v2.1.2版本的,dhc
    發(fā)表于 04-23 08:20

    美國(guó)Merlin公司加速自主飛行模擬器開發(fā)

    美國(guó)Merlin公司正全力加速自主飛行模擬器的開發(fā)進(jìn)程,以推動(dòng)航空領(lǐng)域的創(chuàng)新與發(fā)展。這一舉措不僅體現(xiàn)了Merlin公司在技術(shù)研發(fā)方面的雄厚實(shí)力,也預(yù)示著自主飛行技術(shù)即將迎來新的突破。
    的頭像 發(fā)表于 04-22 11:30 ?649次閱讀

    蘋果停iOS 16.7.6驗(yàn)證,僅支持16.7.7版本驗(yàn)證

    據(jù)悉,蘋果已于4月17日停止了對(duì)iOS 16.7.6版本的驗(yàn)證服務(wù)。對(duì)于已升級(jí)至iOS 16.7.7版本的iPhone用戶來說,他們已無法返回至舊版系統(tǒng)。
    的頭像 發(fā)表于 04-17 10:27 ?1226次閱讀

    使用1.9.0版本時(shí),stm32cubemx生成ETH+LWIP代碼,直接編譯出錯(cuò)的原因?

    字節(jié)內(nèi)容全為0,后256字節(jié)為我本次發(fā)送數(shù)據(jù),第三次768字節(jié),第四次1024字節(jié),都是最后256字節(jié)有新數(shù)據(jù),其余全為0。滿1024字節(jié)后,再也收不到數(shù)據(jù)了。 使用1.9.0版本
    發(fā)表于 03-25 08:10

    機(jī)智云“智家”APP V4.4.22版本發(fā)布

    新功能上線版本更新親愛的機(jī)友們,迎來了機(jī)智云智家APP全新版本V4.4.22的發(fā)布!此次更新,我們?yōu)槟鷰砹艘幌盗袑?shí)用的功能優(yōu)化和全新的體驗(yàn),讓智能生活更加便捷、智慧!更新內(nèi)容一覽01單設(shè)備分享優(yōu)化
    的頭像 發(fā)表于 03-16 08:09 ?440次閱讀
    機(jī)智云“智家”APP V4.4.22<b class='flag-5'>版本</b>發(fā)布
    优博娱乐网址| 24山64卦分金| 菲律宾沙龙国际| 威尼斯人娱乐城送钱| 三元玄空24山坐向开门| 金鼎百家乐官网局部算牌法| 真人轮盘游戏| 广州百家乐娱乐场开户注册 | 博彩通百家乐官网概率| 百家乐作弊视频| 家百家乐官网破解软件| 大发888王博被带走| 玩百家乐去哪个平台好| 百家乐官网电脑赌博| 京城国际娱乐城| 大发888娱乐客户端| 平注打百家乐的方法| 赌神网百家乐官网的玩法技巧和规则 | 沙龙百家乐官网娱乐场| 网上老虎机| 威尼斯人娱乐场 赌场网址| MG百家乐大转轮| 百家乐官网平注法到| 网上百家乐官网赢钱公式| 德州扑克网页游戏| 红树林百家乐的玩法技巧和规则| 做生意风水摆件| 百家乐官网视频网络游戏| 青岛棋牌室| 威尼斯人娱乐城信誉怎样| 鑫鼎百家乐娱乐城| 百家乐开户送10彩金| 网页百家乐官网的玩法技巧和规则 | 伯爵百家乐官网娱乐平台| 线上百家乐官网试玩| 太仆寺旗| 新皇冠现金网怎么样| 威尼斯人娱乐城送宝马| 博九百家乐的玩法技巧和规则| 做生意戴什么珠子招财| 百家乐官网官网网址|