電子發(fā)燒友網(wǎng)>人工智能>NVIDIA發(fā)布Triton 推理服務(wù)器重大更新，全球超過(guò)25000余家公司部署NVIDIA AI推理平臺(tái)

NVIDIA發(fā)布Triton 推理服務(wù)器重大更新，全球超過(guò)25000余家公司部署NVIDIA AI推理平臺(tái)

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等全球行業(yè)領(lǐng)導(dǎo)者都在使用該平臺(tái)。

加利福尼亞州圣克拉拉市 – 2021 年 11 月 9 日 – NVIDIA今日宣布其AI推理平臺(tái)的重大更新，目前Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺(tái)。

這些更新包括開(kāi)源NVIDIA Triton推理服務(wù)器軟件的新功能，該軟件為所有AI模型和框架提供跨平臺(tái)推理；同時(shí)也包含對(duì)NVIDIA TensorRT的更新，該軟件優(yōu)化AI模型并為NVIDIA GPU上的高性能推理提供運(yùn)行時(shí)優(yōu)化。

NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊緣AI推理的低功耗、小尺寸的加速器，其推理性能比CPU高出20倍。

NVIDIA副總裁兼加速計(jì)算總經(jīng)理Ian Buck表示：“NVIDIA AI推理平臺(tái)正在推動(dòng)各行各業(yè)的突破，包括醫(yī)療健康、金融服務(wù)、零售、制造和超級(jí)計(jì)算。無(wú)論是提供更智能的建議，發(fā)揮對(duì)話式AI的力量，還是推進(jìn)科學(xué)發(fā)現(xiàn)，NVIDIA推理平臺(tái)都能以簡(jiǎn)單易用的方式提供低延遲、高吞吐及多種性能組合的服務(wù)，為全球關(guān)鍵的AI新應(yīng)用賦能?！?/p>

關(guān)鍵的軟件優(yōu)化

Triton 推理服務(wù)器的主要更新包括：

● Triton 模型分析器 – 這款新工具可以自動(dòng)化地從數(shù)百種組合中為 AI 模型選擇最佳配置，以實(shí)現(xiàn)最優(yōu)性能，同時(shí)確保應(yīng)用程序所需的服務(wù)質(zhì)量。

● 多 GPU 多節(jié)點(diǎn)功能 – 這一新功能支持基于Transformer的大規(guī)模語(yǔ)言模型，例如 Megatron 530B，在多個(gè)GPU和服務(wù)器節(jié)點(diǎn)上運(yùn)行并提供實(shí)時(shí)推理性能，而不是在單個(gè)GPU上運(yùn)行。

● RAPIDS FIL – 這一針對(duì)隨機(jī)森林和梯度提升決策樹(shù)模型 GPU 或 CPU 推理的新后端為開(kāi)發(fā)者使用 Triton 進(jìn)行深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)提供了一個(gè)統(tǒng)一的部署引擎。

● Amazon SageMaker 集成 – 這種無(wú)縫集成讓客戶能夠在 SageMaker（AWS 完全托管的 AI 服務(wù)）中使用 Triton 輕松部署多框架的模型，并實(shí)現(xiàn)高推理性能。

● 支持 Arm CPU – 除了 NVIDIA GPU 和 x86 CPU 外，Triton 后端現(xiàn)在還支持在 Arm CPU 上優(yōu)化 AI 推理工作負(fù)載。

Triton 支持在云、數(shù)據(jù)中心、企業(yè)邊緣和嵌入式設(shè)備等環(huán)境中對(duì) GPU 和 CPU 進(jìn)行 AI 推理，并與 AWS、Google Cloud、Microsoft Azure、阿里云PAI-EAS 等平臺(tái)集成。此外，NVIDIA AI Enterprise 也集成了 Triton。

NVIDIA AI Enterprise 是一款經(jīng) NVIDIA 優(yōu)化、認(rèn)證和支持的用于開(kāi)發(fā)和部署 AI 的端到端軟件套件，客戶可利用它在本地?cái)?shù)據(jù)中心和私有云的主流服務(wù)器上運(yùn)行 AI 工作負(fù)載。

除了 Triton 外，TensorRT 現(xiàn)在還與TensorFlow和PyTorch集成，只需一行代碼就能提供比框架內(nèi)推理快3倍的性能。這使得開(kāi)發(fā)人員采用極為簡(jiǎn)化的工作流程就可以體會(huì)TensorRT的強(qiáng)大功能。

NVIDIA TensorRT 8.2 是SDK的最新版本，可加速高性能的深度學(xué)習(xí)推理，在云端、本地或邊緣提供高吞吐和低延遲。有了最新的性能優(yōu)化，數(shù)十億個(gè)參數(shù)的語(yǔ)言模型可實(shí)現(xiàn)實(shí)時(shí)運(yùn)行。

行業(yè)領(lǐng)導(dǎo)者支持 NVIDIA AI 平臺(tái)推理

全球眾多行業(yè)領(lǐng)導(dǎo)者都正在使用 NVIDIA AI 推理平臺(tái)改進(jìn)業(yè)務(wù)運(yùn)營(yíng)并為客戶提供新的AI賦能服務(wù)。

Microsoft Azure 認(rèn)知服務(wù)為高品質(zhì) AI 模型提供基于云的 API，以創(chuàng)建智能應(yīng)用程序。他們正在使用Triton 運(yùn)行語(yǔ)音轉(zhuǎn)文本模型，為 Microsoft Teams 用戶提供準(zhǔn)確的實(shí)時(shí)字幕和轉(zhuǎn)錄。

“Microsoft Teams 是全球溝通和協(xié)作的重要工具，每月有近 2.5 億活躍用戶，”Microsoft 團(tuán)隊(duì)呼叫、會(huì)議和設(shè)備部首席 PM 經(jīng)理 Shalendra Chhabra 表示。“這樣的 AI 模型極其復(fù)雜，需要數(shù)千萬(wàn)個(gè)神經(jīng)網(wǎng)絡(luò)參數(shù)才能在幾十種不同的語(yǔ)言中提供準(zhǔn)確的結(jié)果。模型越大，就越難以經(jīng)濟(jì)高效地實(shí)時(shí)運(yùn)行。Microsoft Azure 認(rèn)知服務(wù)上的 NVIDIA GPU 和 Triton 推理服務(wù)器使用 28 種語(yǔ)言和方言，通過(guò) AI 近乎實(shí)時(shí)地幫助改進(jìn)實(shí)時(shí)字幕和轉(zhuǎn)錄功能。”Microsoft Azure 認(rèn)知服務(wù)上的 NVIDIA GPU 和 Triton 推理服務(wù)器，結(jié)合AI模型，幫助提升了涉及28 種語(yǔ)言和方言的實(shí)時(shí)字幕和轉(zhuǎn)錄功能的成本效益。

Samsung Medison 是三星電子旗下一家全球醫(yī)療設(shè)備公司。該公司正利用 NVIDIA TensorRT 通過(guò)智能輔助功能來(lái)為其超聲波系統(tǒng)提供增強(qiáng)的更優(yōu)質(zhì)的醫(yī)療影像。Samsung Medison 致力于通過(guò)提高患者的舒適度、減少掃描時(shí)間、簡(jiǎn)化工作流程并最終提高系統(tǒng)吞吐量來(lái)改善患者和醫(yī)療健康領(lǐng)域?qū)I(yè)人員的生活。

“在新款 V8 高端超聲波系統(tǒng)中應(yīng)用 NVIDIA TensorRT 后，我們能夠在查看和診斷圖像時(shí)更好地為醫(yī)學(xué)專家提供支持，”Samsung Medison 副總裁、客戶體驗(yàn)團(tuán)隊(duì)主管 Won-Chul Bang 表示?！拔覀冋诜e極地將基于 AI 的技術(shù)引入我們的超聲波系統(tǒng)，以便為醫(yī)療專業(yè)人員提供更好的支持，使他們能夠?qū)Ｗ⒂诨颊咴\斷和治療等更重要的領(lǐng)域?！?/p>

Siemens Energy是一家擁有領(lǐng)先能源技術(shù)解決方案的能源專營(yíng)公司，該公司正利用 Triton 通過(guò) AI 來(lái)幫助其發(fā)電廠客戶管理相關(guān)設(shè)施。

“高度復(fù)雜的發(fā)電廠通常會(huì)配備攝像頭和傳感器，但采用的卻是傳統(tǒng)軟件系統(tǒng)，NVIDIA Triton 推理服務(wù)器出色的靈活性能夠讓這些發(fā)電廠加入自主工業(yè)革命，” Siemens Energy自主運(yùn)營(yíng)部投資組合經(jīng)理 Arik Ott 表示。

Snap是一家全球性攝影軟件和社交媒體公司，其主要產(chǎn)品和服務(wù)包括Snapchat、Spectacles和Bitmoji等。Snap正在使用NVIDIA技術(shù)來(lái)提高商業(yè)變現(xiàn)能力和降低成本。

“Snap使用NVIDIA GPU和TensorRT將機(jī)器學(xué)習(xí)推理的成本效率提高了50%，并將服務(wù)延遲降低了2倍，“Snap公司策劃與商業(yè)變現(xiàn)部門(mén)工程副總裁Nima Khajehnouri表示?！边@為我們提供了計(jì)算資源，以實(shí)踐和部署更大型、更準(zhǔn)確的廣告和內(nèi)容排名模型?！?/p>

NVIDIA面向推理的 AI 平臺(tái)包括了新的 NVIDIA 認(rèn)證系統(tǒng)，全新A2 GPU

NVIDIA 認(rèn)證系統(tǒng)可以幫助客戶在高性能、經(jīng)濟(jì)高效且可擴(kuò)展的基礎(chǔ)設(shè)施上為各種現(xiàn)代 AI 應(yīng)用識(shí)別、獲取和部署系統(tǒng)，該認(rèn)證系統(tǒng)現(xiàn)在包含兩個(gè)新的邊緣AI類別。

擴(kuò)展的類別允許 NVIDIA 系統(tǒng)的合作伙伴為客戶提供完整系列的由基于 NVIDIA Ampere 架構(gòu)的 GPU 支持的 NVIDIA 認(rèn)證系統(tǒng)，來(lái)處理各種實(shí)際工作負(fù)載。新的 NVIDIA A2 GPU 也包含在內(nèi)，它是一個(gè)入門(mén)級(jí)、低功耗的緊湊型加速器，適用于邊緣服務(wù)器中的推理和邊緣 AI。 NVIDIA A2與適用于主流企業(yè)服務(wù)器的 NVIDIA A30 、適用高性能 AI 服務(wù)器的 NVIDIA A100 一起，為邊緣、數(shù)據(jù)中心和云端的 AI 推理提供了完整的方案。

Atos、戴爾科技、技嘉、慧與、浪潮、聯(lián)想和 Supermicro 等全球領(lǐng)先的企業(yè)系統(tǒng)供應(yīng)商，其AI系統(tǒng)產(chǎn)品線均支持在 NVIDIA 認(rèn)證系統(tǒng)上使用 NVIDIA AI Enterprise。

其他系統(tǒng)提供商，如研華科技、ASRock Rack、華碩、寧暢、新華三和 QCT 也為各種工作負(fù)載提供了 NVIDIA 認(rèn)證系統(tǒng)。包括研華科技、技嘉和聯(lián)想在內(nèi)的領(lǐng)先供應(yīng)商將很快推出首款通過(guò)新邊緣類別認(rèn)證的 NVIDIA 認(rèn)證系統(tǒng)。

供貨情況

Triton 通過(guò) NVIDIA NGC 目錄提供。NVIDIA NGC是針對(duì) GPU 優(yōu)化的 AI 軟件中心，包括框架、工具包、預(yù)訓(xùn)練模型和 Jupyter Notebooks。Triton源代碼可從 Triton GitHub 資源庫(kù)獲取。

NVIDIA 開(kāi)發(fā)者計(jì)劃成員可通過(guò) TensorRT 頁(yè)面獲取 TensorRT。最新版本的插件、解析器和示例也以開(kāi)源形式提供，可從 TensorRT GitHub 資源庫(kù)獲取。

客戶可以通過(guò)今日獨(dú)家發(fā)布的 NVIDIA LaunchPad中的全球精選實(shí)驗(yàn)室，在 NVIDIA AI Enterprise 軟件套件中體驗(yàn) NVIDIA Triton。

NVIDIA AI Enterprise 軟件套件可通過(guò)全球 NVIDIA 渠道合作伙伴獲取，包括 Atea、Axians、Carahsoft Technology Corp.、Computacenter、Insight Enterprises、Presidio、Sirius、SoftServe、SVA System Vertrieb Alexander GmbH、TD SYNNEX、Trace3 和 WWT。

閱讀全文

cpu(206166) cpu(206166)
NVIDIA(101461) NVIDIA(101461)
gpu(126255) gpu(126255)
服務(wù)器(82172) 服務(wù)器(82172)
AI(263628) AI(263628)

評(píng)論

相關(guān)推薦

NVIDIA擴(kuò)大AI推理性能領(lǐng)先優(yōu)勢(shì)，首次在Arm服務(wù)器上取得佳績(jī)

最新MLPerf基準(zhǔn)測(cè)試表明，NVIDIA已將其在AI推理性能和能效方面的高標(biāo)準(zhǔn)擴(kuò)展到Arm以及x86計(jì)算機(jī)。

2021-09-23 14:18:06

2518

MLPerf V2.0推理結(jié)果放榜，NVIDIA表現(xiàn)搶眼

不久前，AI性能基準(zhǔn)評(píng)測(cè)平臺(tái)MLPerf公布了2022年首次推理（Inference v2.0）測(cè)試成績(jī)，NVIDIA的AI平臺(tái)表現(xiàn)依然搶眼。

2022-04-15 22:12:00

2738

NVIDIA 如何應(yīng)對(duì)會(huì)話式AI帶來(lái)的推理挑戰(zhàn)？

NVIDIA Turing GPU和Xavier 芯片系統(tǒng)在首個(gè)獨(dú)立AI推理基準(zhǔn)測(cè)試 ——MLPerf Inference 0.5中取得第一名。

2019-11-08 16:53:29

5054

NVIDIA打破AI推理性能記錄

　NVIDIA憑借A100進(jìn)一步擴(kuò)大了在MLPerf基準(zhǔn)測(cè)試中的領(lǐng)先優(yōu)勢(shì)，實(shí)現(xiàn)了比CPU快237倍的AI推理性能，助力企業(yè)將AI研究轉(zhuǎn)化為生產(chǎn)力。

2020-10-22 14:07:58

714

NVIDIA 借助超大規(guī)模 AI 語(yǔ)言模型為全球企業(yè)賦能

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語(yǔ)言模型 Megatron 530B；多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語(yǔ)言的AI開(kāi)發(fā)和部署，推動(dòng)行業(yè)和科學(xué)發(fā)展。

2021-11-10 14:22:52

752

40/5000 XenApp 7.14.1和NVIDIA M10許可

Windows Server 2016許可證服務(wù)器上獲取并安裝了環(huán)境的NVIDIA Virtual Applications許可證。選擇虛擬應(yīng)用程序許可證的決定基于使用XenApp（已發(fā)布的應(yīng)用程序/桌面

2018-09-25 17:32:49

Ai 部署的臨界考慮電子指南

雖然GPU解決方案對(duì)訓(xùn)練，AI部署需要更多。預(yù)計(jì)到2020年代中期，人工智能行業(yè)將增長(zhǎng)到200億美元，其中大部分增長(zhǎng)是人工智能推理。英特爾Xeon可擴(kuò)展處理器約占運(yùn)行AI推理的處理器單元的70

2023-08-04 07:25:00

NVIDIA Jetson介紹

首發(fā)極術(shù)社區(qū)如對(duì)Arm相關(guān)技術(shù)感興趣，歡迎私信 aijishu20加入技術(shù)微信群。分享內(nèi)容NVIDIA Jetson是嵌入式計(jì)算平臺(tái)，具有低功耗、高性能和小體積等特點(diǎn)，可加速各行業(yè)的AI應(yīng)用落地

2021-12-14 08:05:01

NVIDIA 在首個(gè)AI推理基準(zhǔn)測(cè)試中大放異彩

此次測(cè)試的十二家公司中，只有NVIDIA AI平臺(tái)提交了 MLPerf的全部五項(xiàng)推理測(cè)試成績(jī)（MLPerf是一個(gè)于2018年5月成立的行業(yè)基準(zhǔn)測(cè)試小組）。這證明了NVIDIA CUDA-X AI

2019-11-08 19:44:51

Nvidia Tesla與Nvidia GRID vGPU購(gòu)買SUMS服務(wù)是否正確理解了所有內(nèi)容

我們計(jì)劃使用2臺(tái)Nvidia Tesla M60顯卡進(jìn)行遠(yuǎn)程管理，并可選擇進(jìn)一步擴(kuò)展，使用HP Apollo 2600服務(wù)器。據(jù)我了解，要部署遠(yuǎn)程虛擬管理，我們需要Nvidia GRID程序

2018-09-13 17:08:32

nVidia許可服務(wù)器存在問(wèn)題

客戶在其環(huán)境中擁有nVidia Licensing服務(wù)器（vSphere Enterprise Plus和Horizo??n 7）。許可證文件在nVidia企業(yè)門(mén)戶中生成，并且許可證服務(wù)器中安裝了2

2018-09-20 11:41:44

可以安裝NVIDIA許可證服務(wù)器嗎？

嗨，我想知道，如果可以安裝NVIDIA許可證服務(wù)器嗎？我沒(méi)有找到任何關(guān)于此的明確文件。 setup.exe也沒(méi)有我能夠使用的任何清晰的開(kāi)關(guān)/參數(shù)。謝謝，延以上來(lái)自于谷歌翻譯以下為原文Hi, I

2018-09-18 16:18:10

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何在RK3399上搭建Tengine AI推理框架呢

Tengine是什么？如何在RK3399這一 Arm64 平臺(tái)上搭建 Tengine AI 推理框架，并運(yùn)行圖像識(shí)別相關(guān)應(yīng)用？

2022-03-07 07:53:43

如何在RK3399這一 Arm64平臺(tái)上搭建Tengine AI推理框架呢

Tengine是什么呢？如何在RK3399這一 Arm64平臺(tái)上搭建Tengine AI推理框架呢？

2022-03-04 12:31:35

深度剖析OpenHarmony AI調(diào)度管理與推理接口

1 簡(jiǎn)介AI任務(wù)管理與統(tǒng)一的推理能力提供了接口的統(tǒng)一標(biāo)準(zhǔn)系統(tǒng)上CPU提供了AI任務(wù)調(diào)度管理的能力，對(duì)AI的能力進(jìn)行了開(kāi)放的推理和推理，同時(shí)，提供了一個(gè)不同的生命周期框架層級(jí)的應(yīng)用程序。推理接口

2022-03-25 11:15:36

深度學(xué)習(xí)推理和計(jì)算-通用AI核心

商業(yè)發(fā)行之前就已經(jīng)過(guò)時(shí)了。算法明天需要對(duì)架構(gòu)、內(nèi)存/數(shù)據(jù)進(jìn)行徹底改革資源和能力。推理的夢(mèng)幻建筑重新定義重寫(xiě)在計(jì)算和交付突破性的人工智能加速和靈活的計(jì)算能力超越了服務(wù)器級(jí)CPU和比GPU/ASIC通用

2020-11-01 09:28:57

NVIDIA深度學(xué)習(xí)平臺(tái)

為幫助數(shù)據(jù)科學(xué)家和開(kāi)發(fā)人員充分利用深度學(xué)習(xí)領(lǐng)域中的機(jī)遇，NVIDIA為其深度學(xué)習(xí)軟件平臺(tái)發(fā)布了三項(xiàng)重大更新，它們分別是NVIDIA DIGITS 4、CUDA深度神經(jīng)網(wǎng)絡(luò)庫(kù)(cuDNN)5.1和全新的GPU推理引擎(GIE)?！　? NVIDIA深度學(xué)習(xí)軟件平臺(tái)推三項(xiàng)重大更新

2016-08-06 15:00:26

1806

NVIDIA在最新AI推理基準(zhǔn)測(cè)試中大獲成功

MLPerf Inference 0.5是業(yè)內(nèi)首個(gè)獨(dú)立AI推理基準(zhǔn)套件，其測(cè)試結(jié)果證明了NVIDIA Turing數(shù)據(jù)中心GPU以及 NVIDIA Xavier 邊緣計(jì)算芯片系統(tǒng)的性能。

2019-11-29 14:45:02

2696

NVIDIA推出一款突破性的推理軟件可以實(shí)現(xiàn)會(huì)話式AI應(yīng)用

2019年12月18日— — NVIDIA于今日發(fā)布一款突破性的推理軟件。借助于該軟件，全球各地的開(kāi)發(fā)者都可以實(shí)現(xiàn)會(huì)話式AI應(yīng)用，大幅減少推理延遲。而此前，巨大的推理延遲一直都是實(shí)現(xiàn)真正交互式互動(dòng)的一大阻礙。

2019-12-19 10:06:51

1045

NVIDIA發(fā)布了首款基于NVIDIA Ampere架構(gòu)的GPU ——NVIDIA A100 GPU

了全球超強(qiáng)大的AI和HPC服務(wù)器平臺(tái)HGX A100，最大可組成AI算力達(dá)10 PFLOPS的超大型服務(wù)器。

2020-06-02 17:11:45

3709

NVIDIA和多家全球領(lǐng)先的服務(wù)器制造商發(fā)布多款內(nèi)置NVIDIA A100的系統(tǒng)

NVIDIA和多家全球領(lǐng)先的服務(wù)器制造商于今日發(fā)布多款內(nèi)置NVIDIA A100的系統(tǒng)。這些系統(tǒng)具有多種不同的設(shè)計(jì)和配置，可應(yīng)對(duì)AI、數(shù)據(jù)科學(xué)和科學(xué)計(jì)算領(lǐng)域最復(fù)雜的挑戰(zhàn)。

2020-06-24 16:04:33

2585

NVIDIA GPU加速AI推理洞察，推動(dòng)跨行業(yè)創(chuàng)新

這些AI模型被運(yùn)行在裝載了V100Tensor Core GPU的NVIDIADGX系統(tǒng)上的數(shù)據(jù)中心服務(wù)器上，以及裝載了JetsonAGX Xavier模塊的邊緣計(jì)算網(wǎng)絡(luò)中。該硬件運(yùn)行NVIDIA

2020-07-02 15:00:54

1819

NVIDIA A100 GPU推理性能237倍碾壓CPU

）的12個(gè)提交者增加了近一倍。結(jié)果顯示，今年5月NVIDIA（Nvidia）發(fā)布的安培（Ampere）架構(gòu)A100 Tensor Core GPU，在云端推理的基準(zhǔn)測(cè)試性能是最先進(jìn)Intel CPU

2020-10-23 17:40:02

3929

NVIDIA公布通過(guò)NVIDIA認(rèn)證系統(tǒng)測(cè)試的全球首批加速服務(wù)器企業(yè) AI 使用量倍增

芯東西1月27日?qǐng)?bào)道，剛剛，NVIDIA公布通過(guò)NVIDIA認(rèn)證系統(tǒng)測(cè)試的全球首批加速服務(wù)器，它們是目前業(yè)內(nèi)唯一通過(guò)現(xiàn)代工作負(fù)載測(cè)試的服務(wù)器，可用于機(jī)器學(xué)習(xí)和分析。通過(guò)NVIDIA認(rèn)證系統(tǒng)的產(chǎn)品

2021-01-27 16:25:59

1716

NVIDIA發(fā)布面向企業(yè)的即時(shí)AI基礎(chǔ)設(shè)施

領(lǐng)導(dǎo)者 Equinix 將首先加入 AI LaunchPad 程序，其將通過(guò) Platform Equinix 平臺(tái)向全球提供由 NVIDIA 支持的混合云解決方案。Equinix 基礎(chǔ)設(shè)施在幾分鐘內(nèi)就能部

2021-06-24 17:35:50

2095

NVIDIA在推理方面取得突破，從云端到邊緣實(shí)現(xiàn)更智能、更具互動(dòng)性的對(duì)話式AI

NVIDIA于今日發(fā)布公司第八代AI軟件TensorRT? 8。該軟件將語(yǔ)言查詢推理時(shí)間縮短了一半，使開(kāi)發(fā)者能夠從云端到邊緣構(gòu)建全球最佳性能的搜索引擎、廣告推薦和聊天機(jī)器人。

2021-07-21 15:07:57

3208

NVIDIA技術(shù)助力線上大模型推理

自然語(yǔ)言理解、匹配排序等等，這些模型的訓(xùn)練和推理都大量依賴于NVIDIA GPU，尤其在推理方面，NVIDIA GPU及相應(yīng)的解決方案都滿足了業(yè)務(wù)所需的延遲和吞吐要求。微信搜索業(yè)務(wù)需要更高效平臺(tái) 微信搜索業(yè)務(wù)由多個(gè)子模塊構(gòu)成，包括查

2021-10-28 15:28:12

1551

NVIDIA為全球企業(yè)開(kāi)發(fā)和部署大型語(yǔ)言模型打開(kāi)一扇新的大門(mén)

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語(yǔ)言模型Megatron 530B；多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語(yǔ)言的AI開(kāi)發(fā)和部署，推動(dòng)行業(yè)和科學(xué)發(fā)展

2021-11-12 14:30:07

1327

NVIDIA宣布其AI推理平臺(tái)的重大更新

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺(tái)。這些更新包括開(kāi)源NVIDIA Triton推理服務(wù)器

2021-11-12 14:42:53

1684

NVIDIA邊緣網(wǎng)絡(luò)技術(shù)加速企業(yè)AI發(fā)展

平臺(tái)），NVIDIA和Mavenir 正在實(shí)現(xiàn)智能邊緣網(wǎng)絡(luò)構(gòu)建方式的創(chuàng)新。企業(yè)和電信公司能夠利用配備聚合加速器的邊緣服務(wù)器快速部署各種AI 技術(shù)，例如同時(shí)部署NVIDIA Metropolis智

2021-11-15 14:25:56

2108

NVIDIA宣布擴(kuò)大NVIDIA LaunchPad計(jì)劃在全球的覆蓋區(qū)域

。符合條件的企業(yè)可以體驗(yàn)用于AI開(kāi)發(fā)的NVIDIA Base Command云服務(wù)、用于AI部署的NVIDIA F

2021-11-15 15:14:50

1546

NVIDIA Triton 推理服務(wù)器助力西門(mén)子提升工業(yè)效率

西門(mén)子能源公司正在發(fā)揮 NVIDIA Triton 推理服務(wù)器的強(qiáng)大力量，利用 AI 協(xié)助解決全球發(fā)電廠在預(yù)測(cè)性服務(wù)管理方面的擔(dān)憂。

2021-11-16 16:25:31

3490

NVIDIA Triton開(kāi)源推理服務(wù)軟件三大功能推動(dòng)效率提升

Microsoft Teams借助AI生成的實(shí)時(shí)字幕和轉(zhuǎn)錄功能，幫助全球學(xué)生和職場(chǎng)人士順利進(jìn)行在線會(huì)議。用于訓(xùn)練的NVIDIA AI計(jì)算技術(shù)和用于推理語(yǔ)音識(shí)別模型的NVIDIA Triton推理服務(wù)器進(jìn)一步提升了這兩個(gè)功能。

2022-01-04 14:20:11

1407

NVIDIA Triton推理服務(wù)器幫助Teams使用認(rèn)知服務(wù)優(yōu)化語(yǔ)音識(shí)別模型

2022-01-04 17:45:12

1472

NVIDIA AI 大力推進(jìn)語(yǔ)音、推薦系統(tǒng)和超大規(guī)模推理領(lǐng)域的發(fā)展

NVIDIA AI 可供開(kāi)發(fā)者免費(fèi)使用，包括用于語(yǔ)音 AI 的 NVIDIA Riva 和用于智能推薦系統(tǒng)的 NVIDIA Merlin?，這兩款軟件均已正式全面上線。而整個(gè)軟件套件也進(jìn)行了更新，包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具包等工具。

2022-03-23 14:27:08

1058

GTC2022大會(huì)黃仁勛：NVIDIA Triton是AI部署的“中央車站”

GTC2022大會(huì)黃仁勛：NVIDIA Triton是AI部署的“中央車站”，支持在每一代NVIDIA GPU、x86和ARM CPU上部署模型。

2022-03-23 16:23:04

1259

NVIDIA助力微軟將AI Transformer模型投入生產(chǎn)用途

Microsoft 的目標(biāo)是，通過(guò)結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強(qiáng)大的 AI Transformer 模型投入生產(chǎn)用途。

2022-03-28 09:43:38

1029

NVIDIA加速VIVO推薦系統(tǒng)部署艾默生公布2022第一季度業(yè)績(jī)

推薦系統(tǒng)的大規(guī)模部署帶來(lái)了諸多工程化挑戰(zhàn)，借助NVIDIA TensorRT， Triton and MPS （Multi-Process Service）及單張T4 GPU推理卡，其性能優(yōu)于約6臺(tái)以上的78核CPU服務(wù)器，成本方面也降低75%。

2022-03-29 15:25:05

1106

NVIDIA TensorRT 8.2將推理速度提高6倍

　　TensorRT 是一款高性能的深度學(xué)習(xí)推理優(yōu)化器和運(yùn)行時(shí)，為人工智能應(yīng)用程序提供低延遲、高吞吐量推理。 TensorRT 用于醫(yī)療、汽車、制造、互聯(lián)網(wǎng)/電信服務(wù)、金融服務(wù)和能源等多個(gè)行業(yè)。

2022-03-31 17:10:29

1469

NVIDIA發(fā)布Riva語(yǔ)音AI和大型LLM軟件

　　它包括Megatron方面的進(jìn)步，這是一個(gè)由 NVIDIA 研究人員領(lǐng)導(dǎo)的開(kāi)源項(xiàng)目，旨在開(kāi)發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ，如 Megatron 530B ，并使用 NVIDIA Triton 推理服務(wù)器跨多個(gè) GPU 和節(jié)點(diǎn)進(jìn)行部署。

2022-04-01 16:27:36

10987

Microsoft使用NVIDIA Triton加速AI Transformer模型應(yīng)用

2022-04-02 13:04:21

1456

使用MIG和Kubernetes部署Triton推理服務(wù)器

　　NVIDIA Triton 推理服務(wù)器是一款開(kāi)源人工智能模型服務(wù)軟件，可簡(jiǎn)化在生產(chǎn)中大規(guī)模部署經(jīng)過(guò)培訓(xùn)的人工智能模型。對(duì)于服務(wù)器管理的任何模型，客戶端可以遠(yuǎn)程向提供的 HTTP 或 gRPC 端點(diǎn)發(fā)送推斷請(qǐng)求。

2022-04-07 09:54:05

2902

使用Bottlerocket和Amazon EC2部署AI模型

　　對(duì)于 AWS 上的人工智能推理部署，您可以利用 NVIDIA Triton 推理服務(wù)器 。使用開(kāi)源推理服務(wù)軟件在任何 CPU 或 CPU 基礎(chǔ)設(shè)施上部署來(lái)自多個(gè)框架的經(jīng)過(guò)培訓(xùn)的人工智能模型，包括 TensorFlow 、 TensorRT 、 PyTorch 、 ONNX 、 XGBoost 和 Python 。

2022-04-08 15:37:28

881

NVIDIA推理平臺(tái)和全棧方法提供最佳性能

現(xiàn)在，您和開(kāi)發(fā)人員社區(qū)的其他成員都可以使用這些成果，主要是以開(kāi)源軟件的形式。此外， TensorRT 和 Triton 推理服務(wù)器可從?NVIDIA NGC?免費(fèi)獲得，以及預(yù)訓(xùn)練模型、深度學(xué)習(xí)框架

2022-04-08 16:31:31

931

NVIDIA Triton推理服務(wù)器簡(jiǎn)化人工智能推理

GKE 的 Triton 推理服務(wù)器應(yīng)用程序是一個(gè) helm chart 部署程序，可自動(dòng)安裝和配置 Triton ，以便在具有 NVIDIA GPU 節(jié)點(diǎn)池的 GKE 集群上使用，包括

2022-04-08 16:43:03

1855

NVIDIA Triton助力騰訊構(gòu)建高性能推理服務(wù)

通過(guò)將 Triton 編譯為動(dòng)態(tài)鏈接庫(kù)，可以方便地鏈入公司內(nèi)部框架，對(duì)接公司的平臺(tái)治理體系。符合 C 語(yǔ)言規(guī)范的 API 也極大降低了用戶的接入成本。

2022-04-10 10:08:31

1104

如何使用Triton進(jìn)行高效的推理部署

一個(gè)完整的醫(yī)療影像推理流程一般包含數(shù)據(jù)的前處理、AI 推理以及數(shù)據(jù)后處理這幾部分。

2022-04-10 15:06:09

2396

用NVIDIA TSPP和Triton推理服務(wù)器加速模型推理

NVIDIA 時(shí)間序列預(yù)測(cè)平臺(tái)提供從訓(xùn)練到時(shí)間序列模型的推斷的端到端 GPU 加速。平臺(tái)中包含的參考示例經(jīng)過(guò)優(yōu)化和認(rèn)證，可在 NVIDIA DGX A100 和 NVIDIA 認(rèn)證系統(tǒng)上運(yùn)行。

2022-04-10 17:44:04

1762

如何使用FIL后端部署XGBOOST模型

　　使用 FIL 后端，NVIDIA Triton 推理服務(wù)器現(xiàn)在提供了一個(gè)高度優(yōu)化的實(shí)時(shí)服務(wù)的森林模型，無(wú)論是在他們自己或旁邊的深度學(xué)習(xí)模型。

2022-04-11 14:35:54

1138

NVIDIA TensorRT助力打造AI計(jì)算機(jī)視覺(jué)算法推理平臺(tái)

“在使用 NVIDIA TensorRT和NVIDIA T4 GPU對(duì)平臺(tái)賦能后，“極星”推理平臺(tái)的算法推理效率得到了進(jìn)一步的提升，更好地支持速接入各類算法、數(shù)據(jù)及智能設(shè)備，實(shí)現(xiàn)AI自閉環(huán)能力，并通過(guò)應(yīng)用服務(wù)和標(biāo)準(zhǔn)化接口，幫助終端客戶低成本實(shí)現(xiàn)AI與業(yè)務(wù)的結(jié)合，快速構(gòu)建智能應(yīng)用。

2022-04-13 14:49:19

862

使用NVIDIA Triton推理服務(wù)器簡(jiǎn)化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個(gè)數(shù)據(jù)中心、云和嵌入式設(shè)備中實(shí)現(xiàn)標(biāo)準(zhǔn)化的可擴(kuò)展生產(chǎn) AI 。它支持多個(gè)框架，在 GPU 和 DLA 等多個(gè)計(jì)算引擎上運(yùn)行模型，處理不同類型的推理查詢。通過(guò)與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應(yīng)用。

2022-04-18 15:40:02

2306

利用NVIDIA Triton推理服務(wù)器加速語(yǔ)音識(shí)別的速度

網(wǎng)易互娛 AI Lab 的研發(fā)人員，基于 Wenet 語(yǔ)音識(shí)別工具進(jìn)行優(yōu)化和創(chuàng)新，利用 NVIDIA Triton 推理服務(wù)器的 GPU Batch Inference 機(jī)制加速了語(yǔ)音識(shí)別的速度，并且降低了成本。

2022-05-13 10:40:19

1481

NVIDIA Triton助力騰訊PCG加速在線推理

　　借助NVIDIA Triton 推理框架，配合 DALI/FIL/Python 等Backend，以及 TensorRT，整體推理服務(wù)的吞吐能力最大提升 6 倍，延遲最大降低 40%。

2022-05-20 15:25:10

2131

使用NVIDIA Triton模型分析器確定最佳AI模型服務(wù)配置

在這篇文章中，我們使用預(yù)訓(xùn)練 BERT Hugging Face 的大型模型，采用 PyTorch 格式。 NVIDIA Triton 推理服務(wù)器可以使用其LibTorch后端為T(mén)orchScript模型提供服務(wù)，也可以使用其 Python 后端為純 PyTorch 模型提供服務(wù)。

2022-05-30 09:38:08

2378

實(shí)現(xiàn)智能制造的工業(yè)推理管道

　　使用 NVIDIA Triton ?聲波風(fēng)廓線儀，愛(ài)夏可在數(shù)據(jù)中心使用高性能 GPU 或在靠近數(shù)據(jù)的邊緣使用 Jetson 邊緣 AI 平臺(tái)部署預(yù)訓(xùn)練模型的優(yōu)化版本。

2022-05-30 09:46:57

609

基于NVIDIA Triton的AI模型高效部署實(shí)踐

NVIDIA Triton 推理服務(wù)器(以前稱為 TensorRT 推理服務(wù)器)是一款開(kāi)源軟件，可簡(jiǎn)化深度學(xué)習(xí)模型在生產(chǎn)環(huán)境中的部署。借助 Triton 推理服務(wù)器，Devops 和 MLops

2022-06-28 15:49:47

1293

NVIDIA助力阿里巴巴天貓精靈大幅提升服務(wù)運(yùn)行效率

NVIDIA Triton 推理服務(wù)器在 NVIDIA T4 GPU 上進(jìn)行高效部署，幫助阿里巴巴天貓精靈流式 TTS 服務(wù)將吞吐提升 50%，首包延時(shí)降低 35%，大幅提升服務(wù)運(yùn)行效率，提升資源利用率。

2022-07-14 10:05:00

817

NVIDIA Triton的概念、特性及主要功能

NVIDIA Triton 推理服務(wù)器是 NVIDIA AI 平臺(tái)的一部分，它是一款開(kāi)源推理服務(wù)軟件，可助力標(biāo)準(zhǔn)化模型的部署和執(zhí)行，并在生產(chǎn)環(huán)境中提供快速且可擴(kuò)展的 AI。

2022-07-18 10:11:26

2525

騰訊云與NVIDIA仍持續(xù)為AI推理加速進(jìn)行合作

騰訊云計(jì)算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個(gè) AI 組件?；?GPU 異構(gòu)計(jì)算平臺(tái)針對(duì)業(yè)界 AI 訓(xùn)練和推理任務(wù)進(jìn)行了全方位的加速優(yōu)化。TACO

2022-08-31 09:24:07

1235

騰訊云TI平臺(tái)利用NVIDIA Triton推理服務(wù)器構(gòu)造不同AI應(yīng)用場(chǎng)景需求

騰訊云 TI 平臺(tái) TI-ONE 利用 NVIDIA Triton 推理服務(wù)器構(gòu)造高性能推理服務(wù)部署平臺(tái)，使用戶能夠非常便捷地部署包括 TNN 模型在內(nèi)的多種深度學(xué)習(xí)框架下獲得的 AI 模型，并且顯著提升推理服務(wù)的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

1419

螞蟻鏈AIoT團(tuán)隊(duì)與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團(tuán)隊(duì)與 NVIDIA 合作，將量化感知訓(xùn)練(QAT)技術(shù)應(yīng)用于深度學(xué)習(xí)模型性能優(yōu)化中，并通過(guò) NVIDIA TensorRT 高性能推理 SDK 進(jìn)行高效率部署，通過(guò) INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權(quán) AI 平臺(tái)中的模型推理服務(wù)大幅降本增效。

2022-09-09 09:53:52

872

蔚來(lái)基于NVIDIA Triton搭建的推理服務(wù)平臺(tái)

在近日舉行的 GTC 大會(huì)上，蔚來(lái) AI 平臺(tái)負(fù)責(zé)人白宇利帶來(lái)非常有價(jià)值的分享，他首次對(duì)外透露了蔚來(lái)自研的全棧式自動(dòng)駕駛系統(tǒng)（NAD）的部署和開(kāi)發(fā)情況，同時(shí)也將蔚來(lái)自動(dòng)駕駛研發(fā)平臺(tái)（NADP）這個(gè)神秘的“Peta Factory”帶到了公眾視野中。

2022-10-09 10:18:20

661

使用推理服務(wù)器加速大型Transformer模型的推理

這是討論 NVIDIA FasterTransformer 庫(kù)的兩部分系列的第一部分，該庫(kù)是用于對(duì)任意大小（多達(dá)數(shù)萬(wàn)億個(gè)參數(shù)）的Transformer進(jìn)行分布式推理的最快庫(kù)之一。它提供了 FasterTransformer 的概述，包括使用該庫(kù)的好處。

2022-10-10 16:07:48

1067

使用NVIDIA Triton解決人工智能推斷挑戰(zhàn)

Triton 為高效的多模型推理帶來(lái)了一種新的模型編排服務(wù)。該軟件應(yīng)用程序目前處于早期使用階段，有助于以資源高效的方式簡(jiǎn)化 Kubernetes 中 Triton 實(shí)例的部署，其中包含許多模型。此服務(wù)的一些關(guān)鍵功能包括：

2022-10-11 14:24:32

972

NADP加Triton搭建穩(wěn)定高效的推理平臺(tái)

蔚來(lái)自動(dòng)駕駛研發(fā)平臺(tái)（NADP）是著力服務(wù)于自動(dòng)駕駛核心業(yè)務(wù)方向的研發(fā)平臺(tái)。平臺(tái)化的推理能力作為常規(guī)機(jī)器學(xué)習(xí)平臺(tái)的重要組成部分，也是NADP所重點(diǎn)建設(shè)和支持的能力之一。 NADP所支持的推理業(yè)務(wù)，整體上有以下幾個(gè)特性：

2022-10-12 09:32:29

724

通過(guò)稀疏性支持和變壓器優(yōu)化增強(qiáng)AI推理

　　NVIDIA 張量RT 是一個(gè)高性能推理平臺(tái)，對(duì)于利用 NVIDIA 張量核心 GPU 的強(qiáng)大功能至關(guān)重要。TensorRT 8 是一個(gè)具有增強(qiáng)功能的軟件開(kāi)發(fā)工具包，旨在提高性能和準(zhǔn)確性，以應(yīng)對(duì)邊緣和嵌入式設(shè)備中發(fā)生的越來(lái)越多的 AI 推理。它允許對(duì)張量流和PyTorch神經(jīng)網(wǎng)絡(luò)進(jìn)行廣泛的計(jì)算推斷。

2022-10-18 09:32:46

390

NVIDIA GPU加速潞晨科技Colossal-AI大模型開(kāi)發(fā)進(jìn)程

通過(guò) NVIDIA GPU 加速平臺(tái)，Colossal-AI 實(shí)現(xiàn)了通過(guò)高效多維并行、異構(gòu)內(nèi)存管理、大規(guī)模優(yōu)化庫(kù)、自適應(yīng)任務(wù)調(diào)度等方式，更高效快速部署 AI 大模型訓(xùn)練與推理。

2022-10-19 09:39:39

1149

NVIDIA Triton推理服務(wù)器的基本特性及應(yīng)用案例

推理識(shí)別是人工智能最重要的落地應(yīng)用，其他與深度學(xué)習(xí)相關(guān)的數(shù)據(jù)收集、標(biāo)注、模型訓(xùn)練等工作，都是為了得到更好的最終推理性能與效果。

2022-10-26 09:43:57

1370

NVIDIA Triton推理服務(wù)器的功能與架構(gòu)簡(jiǎn)介

前面文章介紹微軟 Teams 會(huì)議系統(tǒng)、微信軟件與騰訊 PCG 服務(wù)三個(gè) Triton 推理服務(wù)器的成功案例，讓大家對(duì) Triton 有初步的認(rèn)知，但別誤以為這個(gè)軟件只適合在大型的服務(wù)類應(yīng)用中使用，事實(shí)上 Triton 能適用于更廣泛的推理環(huán)節(jié)中，并且在越復(fù)雜的應(yīng)用環(huán)境中就越能展現(xiàn)其執(zhí)行成效。

2022-11-02 10:44:41

1813

NVIDIA Triton系列文章：開(kāi)發(fā)資源說(shuō)明

與 Getting Started 屬于入門(mén)范疇，其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個(gè)部分，都是 Triton 推理服務(wù)器非常重要的技術(shù)內(nèi)容。

2022-11-09 16:17:46

506

NVIDIA Triton 系列文章（4）：創(chuàng)建模型倉(cāng)

推理模型倉(cāng)（inference model repository）是 Triton 推理服務(wù)器的最基礎(chǔ)元件，如同數(shù)據(jù)庫(kù)（database）服務(wù)器必須先創(chuàng)建一個(gè)數(shù)據(jù)庫(kù)是類似的道理。要使

2022-11-15 21:20:12

589

NVIDIA Triton 系列文章（5）：安裝服務(wù)器軟件

在前一篇文章已經(jīng)帶著讀者創(chuàng)建一個(gè) Triton 的推理模型倉(cāng)，現(xiàn)在只要安裝好服務(wù)器端與用戶端軟件，就能進(jìn)行基本的測(cè)試與體驗(yàn)。為了簡(jiǎn)化過(guò)程，我們使用 NVIDIA Jetson AGX Orin

2022-11-22 19:50:02

882

NVIDIA Triton 系列文章（6）：安裝用戶端軟件

在前面的文章中，已經(jīng)帶著讀者創(chuàng)建好 Triton 的模型倉(cāng)、安裝并執(zhí)行 Triton 推理服務(wù)器軟件，接下來(lái)就是要安裝 Triton 用戶端軟件，對(duì)服務(wù)器提出推理請(qǐng)求（requests），才能觸發(fā)

2022-11-29 19:20:06

751

在 NGC 上玩轉(zhuǎn)新一代推理部署工具 FastDeploy，幾行代碼搞定 AI 部署

模型，并提供開(kāi)箱即用的云邊端部署體驗(yàn)，實(shí)現(xiàn) AI 模型端到端的推理性能優(yōu)化。歡迎廣大開(kāi)發(fā)者使用 NVIDIA 與飛槳聯(lián)合深度適配的 NGC 飛槳容器，在 NVIDIA GPU 上進(jìn)

2022-12-13 19:50:05

909

NVIDIA Triton 系列文章（9）：為服務(wù)器添加模型

的材料，處理起來(lái)是很容易的，比較復(fù)雜的部分是配置文件 config.pbtxt 的內(nèi)容，里面提供 Triton 服務(wù)器用來(lái)管理模型執(zhí)行特

2022-12-27 21:20:07

715

NVIDIA Triton 系列文章（10）：模型并發(fā)執(zhí)行

前面已經(jīng)做好了每個(gè)推理模型的基礎(chǔ)配置，基本上就能正常讓 Triton 服務(wù)器使用這些獨(dú)立模型進(jìn)行推理。接下來(lái)的重點(diǎn)，就是要讓設(shè)備的計(jì)算資源盡可能地充分使用，首先第一件事情就是模型并發(fā)執(zhí)行

2023-01-05 11:55:06

637

NVIDIA 助力 DeepRec 為 vivo 推薦業(yè)務(wù)實(shí)現(xiàn)高性能 GPU 推理優(yōu)化

本案例中，vivo 人工智能推薦算法組自研的推薦服務(wù)平臺(tái)，使用阿里巴巴開(kāi)源大規(guī)模稀疏模型訓(xùn)練和預(yù)測(cè)引擎 DeepRec，在稀疏模型訓(xùn)練（稀疏功能、I/O 優(yōu)化）和高性能推理框架層面，實(shí)現(xiàn)其搜廣推各類

2023-01-18 00:55:01

548

如何最大化推理性能？Triton 社區(qū)技術(shù)交流活動(dòng)與您暢聊

、NVIDIA 的技術(shù)專家將帶來(lái) AI Infra 、推理引擎相關(guān)的專題分享，包括目前各企業(yè)面臨的模型推理挑戰(zhàn)、Triton 的應(yīng)用及落地的具體方案等，現(xiàn)身說(shuō)法，干貨十足。此外，還有來(lái)自

2023-02-15 16:10:05

207

寧暢率先支持NVIDIA L4 和 L40 GPU

從元宇宙到AIGC，全球AI熱潮迭起，拉動(dòng)巨大算力需求。作為AI與元宇宙全球盛會(huì)，于3月20-23日舉行的NVIDIA GTC將展示這一輪新的全球技術(shù)變革。寧暢X620 G50全能型AI服務(wù)器率先

2023-03-22 14:27:49

525

NVIDIA推出用于大型語(yǔ)言模型和生成式AI工作負(fù)載的推理平臺(tái)

日 – NVIDIA于今日推出四款推理平臺(tái)。這些平臺(tái)針對(duì)各種快速興起的生成式AI應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開(kāi)發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的AI驅(qū)動(dòng)的專業(yè)應(yīng)用。 ? 這些平臺(tái)將NVIDIA的全棧推理

2023-03-22 14:48:39

256

GTC23 | NVIDIA 推出用于大型語(yǔ)言模型和生成式 AI 工作負(fù)載的推理平臺(tái)

日 – NVIDIA 于今日推出四款推理平臺(tái)。這些平臺(tái)針對(duì)各種快速興起的生成式 AI 應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開(kāi)發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的 AI 驅(qū)動(dòng)的專業(yè)應(yīng)用。這些平臺(tái)將 NVIDIA

2023-03-23 06:55:02

654

GTC23 | NVIDIA 攜手谷歌云提供強(qiáng)大的全新生成式 AI 平臺(tái)，基于新款 L4 GPU 和 Vertex AI 構(gòu)建

NVIDIA 生成式 AI 推理平臺(tái)將集成至谷歌云 Vertex AI 中；谷歌云成為首家提供 NVIDIA L4 GPU 實(shí)例的云服務(wù)商加利福尼亞州圣克拉拉 – GTC – 太平洋時(shí)間 2023

2023-03-23 06:55:02

438

超過(guò)1000家公司正在使用NVIDIA Metropolis開(kāi)發(fā)者工具視覺(jué)AI解決方案

NVIDIA在3月23日周四舉行的全球AI和元宇宙大會(huì)GTC上發(fā)布了多項(xiàng)引爆新一輪視覺(jué)AI熱潮的技術(shù)更新，包括用于創(chuàng)建自定義生產(chǎn)級(jí)AI模型的NVIDIA TAO工具套件5.0、用于開(kāi)發(fā)視覺(jué)AI應(yīng)用和服務(wù)的軟件開(kāi)發(fā)工具套件NVIDIA DeepStream擴(kuò)展...

2023-03-27 16:57:40

927

NVIDIA 在 MLPerf 測(cè)試中將推理帶到新高度

的第三方基準(zhǔn)測(cè)試，MLPerf 仍是衡量 AI 性能的權(quán)威標(biāo)準(zhǔn)。自 MLPerf 誕生以來(lái)，NVIDIA 的 AI 平臺(tái)在訓(xùn)練和推理這兩個(gè)方面一直展現(xiàn)出領(lǐng)先優(yōu)勢(shì)，包括最新發(fā)布的 MLPerf

2023-04-08 00:30:08

389

NVIDIA GPU 加速 WPS Office AI 服務(wù)，助力打造優(yōu)質(zhì)的用戶體驗(yàn)

案例介紹金山辦公與 NVIDIA 團(tuán)隊(duì)合作，通過(guò) NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識(shí)別與理解的推理效率；借助 NVIDIA Triton 推理服務(wù)器

2023-06-29 21:35:04

366

如何使用NVIDIA Triton 推理服務(wù)器來(lái)運(yùn)行推理管道

使用集成模型在 NVIDIA Triton 推理服務(wù)器上為 ML 模型管道提供服務(wù)

2023-07-05 16:30:34

1082

SIGGRAPH 2023 | NVIDIA 與全球數(shù)據(jù)中心系統(tǒng)制造商大力推動(dòng) AI 與工業(yè)數(shù)字化的發(fā)展

OVX 服務(wù)器采用全新 NVIDIA GPU 以加速訓(xùn)練和推理以及圖形密集型工作負(fù)載，將通過(guò)戴爾科技、慧與、聯(lián)想、超微等公司提供。洛杉磯 — SIGGRAPH — 太平洋時(shí)間 2023

2023-08-09 19:10:06

264

生成式AI時(shí)代要來(lái)了嗎 NVIDIA生成式AI獲新突破

這些性能強(qiáng)大的新系統(tǒng)將利用 NVIDIA Omniverse 平臺(tái)加速高計(jì)算密集度的復(fù)雜應(yīng)用，包括 AI 訓(xùn)練和推理、3D 設(shè)計(jì)和可視化、視頻處理、工業(yè)數(shù)字化等。

2023-08-23 14:20:18

224

全球領(lǐng)先系統(tǒng)制造商推出 NVIDIA AI 就緒型服務(wù)器，為企業(yè)大幅提升生成式 AI 性能

with NVIDIA 拉斯維加斯 — VMware Explore — 太平洋時(shí)間 2023 年 8 月 22 日 — NVIDIA 宣布，全球領(lǐng)先的系統(tǒng)制造商將推出 AI 就緒型服務(wù)器，其支持同發(fā)布的 VMware

2023-08-23 19:10:09

350

NVIDIA Grace Hopper 超級(jí)芯片橫掃 MLPerf 推理基準(zhǔn)測(cè)試

超級(jí)芯片首次亮相 MLPerf 行業(yè)基準(zhǔn)測(cè)試，其運(yùn)行了所有數(shù)據(jù)中心推理測(cè)試，進(jìn)一步擴(kuò)大了 NVIDIA H100 Tensor Core GPU 的領(lǐng)先優(yōu)勢(shì)。總體測(cè)試結(jié)果表明，NVIDIA AI

2023-09-12 20:40:04

249

NVIDIA Grace Hopper超級(jí)芯片橫掃M(jìn)LPerf推理基準(zhǔn)測(cè)試

Hopper超級(jí)芯片首次亮相 MLPerf 行業(yè)基準(zhǔn)測(cè)試，其運(yùn)行了所有數(shù)據(jù)中心推理測(cè)試，進(jìn)一步擴(kuò)大了NVIDIA H100 Tensor Core GPU的領(lǐng)先優(yōu)勢(shì)。 ? 總體測(cè)試結(jié)果表明，NVIDIA AI

2023-09-13 09:45:40

139

周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

，使用 NVIDIA Triton TM? 推理服務(wù)器進(jìn)行端到端部署 LLM Serving，以及金融行業(yè)的 AI、NLP/LLM 應(yīng)用場(chǎng)景、客戶案例。通過(guò)本次活動(dòng)，您將了解基于上述產(chǎn)品的 LLM

2023-10-26 09:05:02

174

NVIDIA 為全球領(lǐng)先的 AI 計(jì)算平臺(tái) Hopper 再添新動(dòng)力

NVIDIA HGX? H200，為 Hopper 這一全球領(lǐng)先的 AI 計(jì)算平臺(tái)再添新動(dòng)力。NVIDIA HGX H200 平臺(tái)基于 NVIDIA Hopper? 架構(gòu)，搭載 NVIDIA H200

2023-11-14 14:30:01

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

和初創(chuàng)公司在 Microsoft Azure 上開(kāi)發(fā)、調(diào)優(yōu)和部署其自定義生成式 AI 應(yīng)用。 ? 這項(xiàng) NVIDIA AI foundry 服務(wù)整合了 NVIDIA AI Foundation

2023-11-16 14:13:08

116

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

AI Enterprise 軟件進(jìn)行部署 NVIDIA 于今日推出一項(xiàng) AI foundry 服務(wù)，助力企業(yè)和初創(chuàng)公司在 Microsoft Azure 上開(kāi)發(fā)、調(diào)優(yōu)和部署其自定義生成式 AI

2023-11-16 21:15:02

270