吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Gemma優(yōu)化后可在NVIDIA GPU上運行

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 2024-02-25 11:01 ? 次閱讀

借助 TensorRT-LLM,Google 全新開放語言模型可在 NVIDIA AI 平臺(包括本地 RTX AI PC)上加速運行。

2024 年 2 月 21 日,NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發(fā)布面向 Gemma 的優(yōu)化功能,Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型,可在任何地方運行,從而降低成本并加快特定領(lǐng)域用戶案例的創(chuàng)新工作。

NVIDIA 和 Google 的團隊緊密合作,利用 NVIDIA TensorRT-LLM(用于優(yōu)化大語言模型推理性能的開源庫),在數(shù)據(jù)中心的 NVIDIA GPU云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時,加速 Gemma 性能(Gemma 由創(chuàng)建 Gemini 模型的相同研究和技術(shù)構(gòu)建)。

這使開發(fā)者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發(fā)。

開發(fā)者還可在搭載 NVIDIA GPU 的云端運行 Gemma,該實例擁有 141GB HBM3e 顯存,速度為 4.8TB/秒,Google 將于今年部署該實例。

此外,企業(yè)級開發(fā)者還可利用 NVIDIA 豐富的工具生態(tài)系統(tǒng)(包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM),對 Gemma 進行微調(diào),并將優(yōu)化后的模型部署到生產(chǎn)應(yīng)用中。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103722
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7860

    瀏覽量

    137871
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4775

    瀏覽量

    129357

原文標(biāo)題:共耀光芒:Google Gemma 優(yōu)化后可在 NVIDIA GPU 上運行

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?223次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    。 2. 操作系統(tǒng)支持:CST Studio Suite在不同操作系統(tǒng)持續(xù)測試,可在支持的操作系統(tǒng)使用GPU計算,具體參考相關(guān)文檔。 3. 許可證:
    發(fā)表于 12-16 14:25

    NVIDIA NIM微服務(wù)登陸亞馬遜云科技

    經(jīng)過優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 獲取,用于各種 NVIDI
    的頭像 發(fā)表于 12-06 13:33 ?307次閱讀

    如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

    并從計算節(jié)點成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)。
    的頭像 發(fā)表于 11-06 16:03 ?476次閱讀
    如何構(gòu)建及<b class='flag-5'>優(yōu)化</b><b class='flag-5'>GPU</b>云網(wǎng)絡(luò)

    AMD與NVIDIA GPU優(yōu)缺點

    NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗,而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近,但在光線追蹤技術(shù)
    的頭像 發(fā)表于 10-27 11:15 ?1006次閱讀

    TI TDA2x SoC基于GPU的環(huán)視優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TI TDA2x SoC基于GPU的環(huán)視優(yōu)化.pdf》資料免費下載
    發(fā)表于 10-10 09:14 ?0次下載
    TI TDA2x SoC<b class='flag-5'>上</b>基于<b class='flag-5'>GPU</b>的環(huán)視<b class='flag-5'>優(yōu)化</b>

    Google Gemma 2模型的部署和Fine-Tune演示

    Google 近期發(fā)布了最新開放模型 Gemma 2,目前與同等規(guī)模的開放模型相比,取得了明顯的優(yōu)勢,同時在安全可控性上得到了顯著的增強。
    的頭像 發(fā)表于 08-09 17:04 ?681次閱讀
    <b class='flag-5'>Google</b> <b class='flag-5'>Gemma</b> 2模型的部署和Fine-Tune演示

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    英國公司實現(xiàn)英偉達(dá)CUDA軟件在AMD GPU的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU的無縫遷移與運行,標(biāo)志著在
    的頭像 發(fā)表于 07-18 14:40 ?713次閱讀

    使用google-translate和wwe合并無法使用google-tts怎么解決?

    ,在使用喚醒詞喚醒,我想讓他使用google-tts說一句話,但是出現(xiàn)以下錯誤Code: Select all I (16188) wwe_example: rec_engine_cb
    發(fā)表于 06-28 06:05

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優(yōu)化從 PC 到云端的 NVID
    的頭像 發(fā)表于 04-28 10:36 ?637次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開源大語言模型采用 NVIDIA 技術(shù)構(gòu)建,其經(jīng)過優(yōu)化可在云、數(shù)據(jù)中心、邊緣和 PC 的 NVIDIA
    的頭像 發(fā)表于 04-23 09:52 ?524次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?822次閱讀

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎(chǔ)設(shè)施

    NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò),打造性能最強大的 AI 專用基礎(chǔ)設(shè)施 NVIDIA Spectrum-X800 以太網(wǎng)絡(luò),數(shù)據(jù)中心必備的優(yōu)化 AI 網(wǎng)絡(luò)
    發(fā)表于 03-19 10:05 ?411次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機,全面<b class='flag-5'>優(yōu)化</b>萬億參數(shù)級 <b class='flag-5'>GPU</b> 計算和 AI 基礎(chǔ)設(shè)施

    TensorRT LLM加速GemmaNVIDIA與谷歌牽手,RTX助推AI聊天

    NVIDIA今天在其官方博客中表示,今天與谷歌合作,在所有NVIDIA AI平臺上為Gemma推出了優(yōu)化
    的頭像 發(fā)表于 02-23 09:42 ?663次閱讀
    TensorRT LLM加速<b class='flag-5'>Gemma</b>!<b class='flag-5'>NVIDIA</b>與谷歌牽手,RTX助推AI聊天
    百家乐平注常赢打法| 百家乐官网技术秘籍| 皇冠百家乐官网的玩法技巧和规则 | 澳门娱乐城官网| 百家乐官网打印机破解| 娱乐城百家乐的玩法技巧和规则| 百家乐官网二号博彩正网| 赌场百家乐破解| 定结县| 百家乐注册送免费金| 江门市| 澳门百家乐海洋阿强| 左贡县| 现场百家乐牌路分析| 百家乐官网真人游戏开户| 自贡百家乐娱乐场开户注册| 金赞百家乐官网娱乐城| 百家乐筹码桌布| 百家乐官网路单破解器| 同花顺百家乐的玩法技巧和规则 | 第一足球网| 百家乐注码方法| 东平县| 至尊百家乐官网20130201| 大发888出纳柜台 在线| 百家乐官网玩法介| 易发国际| 中国百家乐游戏| 网上百家乐官网有假的吗| 金杯百家乐的玩法技巧和规则| 博彩百家乐官网软件| 百家乐那里最好| 金樽百家乐官网的玩法技巧和规则| 大发888在线体育官网| 彩会百家乐游戏| 百家乐官网真人游戏开户| 大发888娱乐城下栽| 24山 分金 水口 论 吉凶| 肥东县| 全讯网社区| 24 山杨公斗首择日吉凶|