Google Gemma優(yōu)化后可在NVIDIA GPU上運行

借助 TensorRT-LLM，Google 全新開放語言模型可在 NVIDIA AI 平臺（包括本地 RTX AI PC）上加速運行。

2024 年 2 月 21 日，NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發(fā)布面向 Gemma 的優(yōu)化功能，Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型，可在任何地方運行，從而降低成本并加快特定領(lǐng)域用戶案例的創(chuàng)新工作。

NVIDIA 和 Google 的團隊緊密合作，利用 NVIDIA TensorRT-LLM（用于優(yōu)化大語言模型推理性能的開源庫），在數(shù)據(jù)中心的 NVIDIA GPU、云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時，加速 Gemma 性能（Gemma 由創(chuàng)建 Gemini 模型的相同研究和技術(shù)構(gòu)建）。

這使開發(fā)者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發(fā)。

開發(fā)者還可在搭載 NVIDIA GPU 的云端運行 Gemma，該實例擁有 141GB HBM3e 顯存，速度為 4.8TB/秒，Google 將于今年部署該實例。

此外，企業(yè)級開發(fā)者還可利用 NVIDIA 豐富的工具生態(tài)系統(tǒng)（包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM），對 Gemma 進行微調(diào)，并將優(yōu)化后的模型部署到生產(chǎn)應(yīng)用中。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5076

瀏覽量
103722
云計算

云計算

+關(guān)注

關(guān)注
39

文章
7860

瀏覽量
137871
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4775

瀏覽量
129357

原文標(biāo)題：共耀光芒：Google Gemma 優(yōu)化后可在 NVIDIA GPU 上運行

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA和GeForce RTX GPU專為AI時代打造

NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。

發(fā)表于 01-06 10:45 ?223次閱讀

《CST Studio Suite 2024 GPU加速計算指南》

。 2. 操作系統(tǒng)支持：CST Studio Suite在不同操作系統(tǒng)上持續(xù)測試，可在支持的操作系統(tǒng)上使用GPU計算，具體參考相關(guān)文檔。 3. 許可證：

發(fā)表于 12-16 14:25

NVIDIA NIM微服務(wù)登陸亞馬遜云科技

經(jīng)過優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取，用于各種 NVIDI

發(fā)表于 12-06 13:33 ?307次閱讀

如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

并從計算節(jié)點成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)。

發(fā)表于 11-06 16:03 ?476次閱讀

AMD與NVIDIA GPU優(yōu)缺點

，NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場。例如，NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗，而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近，但在光線追蹤技術(shù)上

發(fā)表于 10-27 11:15 ?1006次閱讀

TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化

電子發(fā)燒友網(wǎng)站提供《TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化.pdf》資料免費下載

發(fā)表于 10-10 09:14 ?0次下載

Google Gemma 2模型的部署和Fine-Tune演示

Google 近期發(fā)布了最新開放模型 Gemma 2，目前與同等規(guī)模的開放模型相比，取得了明顯的優(yōu)勢，同時在安全可控性上得到了顯著的增強。

發(fā)表于 08-09 17:04 ?681次閱讀

暴漲預(yù)警！NVIDIA GPU供應(yīng)大跳水

gpu

jf_02331860
發(fā)布于 :2024年07月26日 09:41:42

英國公司實現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運行

7月18日最新資訊，英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”，該工具包實現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無縫遷移與運行，標(biāo)志著在

發(fā)表于 07-18 14:40 ?713次閱讀

使用google-translate和wwe合并后無法使用google-tts怎么解決？

，在使用喚醒詞喚醒后，我想讓他使用google-tts說一句話，但是出現(xiàn)以下錯誤Code: Select all I (16188) wwe_example: rec_engine_cb

發(fā)表于 06-28 06:05

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優(yōu)化從 PC 到云端的 NVID

發(fā)表于 04-28 10:36 ?637次閱讀

NVIDIA全面加快Meta Llama 3的推理速度

Meta 最新開源大語言模型采用 NVIDIA 技術(shù)構(gòu)建，其經(jīng)過優(yōu)化后可在云、數(shù)據(jù)中心、邊緣和 PC 的 NVIDIA

發(fā)表于 04-23 09:52 ?524次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于

發(fā)表于 04-20 09:39 ?822次閱讀

NVIDIA 發(fā)布全新交換機，全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎(chǔ)設(shè)施

NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)，打造性能最強大的 AI 專用基礎(chǔ)設(shè)施 NVIDIA Spectrum-X800 以太網(wǎng)絡(luò)，數(shù)據(jù)中心必備的優(yōu)化 AI 網(wǎng)絡(luò)

發(fā)表于 03-19 10:05 ?411次閱讀

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天

NVIDIA今天在其官方博客中表示，今天與谷歌合作，在所有NVIDIA AI平臺上為Gemma推出了優(yōu)化。

發(fā)表于 02-23 09:42 ?663次閱讀

NVIDIA英偉達(dá)
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New NVIDIA Ollama助力增強Brave瀏覽器用戶體驗
New NVIDIA助力元形水滴提升3D數(shù)字人技術(shù)性能

精選推薦
更多

文章

資料

帖子

如何使用MATLAB構(gòu)建Transformer模型

MATLAB
35分鐘前

72 閱讀

線性穩(wěn)壓器的另外一種用法

上海為昕科技有限公司
17小時前

110 閱讀

電源篇：想讓你的電路更穩(wěn)定、更高效嗎? LDO告訴你答案

上海為昕科技有限公司
17小時前

97 閱讀

高階智駕下半場，誰主沉浮？

智駕最前沿
1小時前

98 閱讀

基于恩智浦LPC5536的光伏MPPT控制方案

恩智浦MCU加油站
1小時前

148 閱讀

電腦愛好者2011年第15期

h1654155805.2625
45.5 MB

免費

0下載

MCS51單片機結(jié)構(gòu)詳解

lanlanw
173 KB

免費

1138下載

Playwright E2E測試工具

那些年兒ing
37.33 MB

免費

0下載

KJCategories objective-C開發(fā)加速庫

劉娟
3.45 MB

免費

0下載

SMD 555定時器鋼琴設(shè)計案例

石玉蘭
0.02 MB

2積分

5下載

【貝啟科技BQ3568HM開源鴻蒙開發(fā)板深度試用報告】3 - 智能家居中控屏連接華為云IoTDA物聯(lián)網(wǎng)平臺

zealsoft
10小時前

21 閱讀

【ELF 2學(xué)習(xí)板試用】ELF 2開發(fā)板的鏡像燒錄與網(wǎng)線連接配置

jf_97245988
1天前

99 閱讀

一個藍(lán)牙音響模式DIY過程遇到的困境

jf_38650294
1天前

94 閱讀

RK3588 原廠設(shè)計資料首次公開（規(guī)格書+原理圖+設(shè)計說明+DDR參考），速搶

h1654155861.7375
1天前

444 閱讀

【貝啟科技BQ3568HM開源鴻蒙開發(fā)板深度試用報告】2-上電體驗

jf_36765885
1天前

401 閱讀

推薦專欄
更多

吴忠躺衫网络科技有限公司

搜索歷史

Google Gemma優(yōu)化后可在NVIDIA GPU上運行

評論

NVIDIA和GeForce RTX GPU專為AI時代打造

《CST Studio Suite 2024 GPU加速計算指南》

NVIDIA NIM微服務(wù)登陸亞馬遜云科技

如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

AMD與NVIDIA GPU優(yōu)缺點

TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化

Google Gemma 2模型的部署和Fine-Tune演示

暴漲預(yù)警！NVIDIA GPU供應(yīng)大跳水

英國公司實現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運行

使用google-translate和wwe合并后無法使用google-tts怎么解決？

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA全面加快Meta Llama 3的推理速度

利用NVIDIA組件提升GPU推理的吞吐

NVIDIA 發(fā)布全新交換機，全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎(chǔ)設(shè)施

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天