吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

虹科分享 | 谷歌Vertex AI平臺使用Redis搭建大語言模型

廣州虹科電子 ? 來源: 廣州虹科電子 ? 作者: 廣州虹科電子 ? 2023-09-18 11:26 ? 次閱讀

基礎模型和高性能數據層這兩個基本組件始終是創建高效、可擴展語言模型應用的關鍵,利用Redis搭建大語言模型,能夠實現高效可擴展的語義搜索、檢索增強生成、LLM 緩存機制、LLM記憶和持久化。有Redis加持的大語言模型可應用于文檔檢索、虛擬購物助手、客戶服務助理等,為企業帶來益處。

一、語言模型構件

應用程序生成、理解和使用人類語言的能力正變得越來越重要,從客服機器人到虛擬助手,再到內容生成,人們對AI應用功能的需求橫跨眾多領域,而這一切的實現,都要歸功于谷歌的 PaLM 2 等基礎模型,這些模型經過精心調教,可以生成類似人類表達風格的內容。

在這一動態環境中,基礎模型和高性能數據層這兩個基本組件始終是創建高效、可擴展語言模型應用的關鍵。

1.基礎模型

基礎模型是生成式人工智能應用的基石,大型語言模型(Large Language Model,LLM)是其中的一個子集。 LLM 通過大量的文本訓練,使其能夠為各種任務生成具有上下文相關性的類似人類表達風格的文本。改進這些模型,使其更加復雜,從而使應用可以更精煉、更有效地響應用戶輸入。所選擇的語言模型會顯著影響應用的性能、成本和服務質量。

然而,PaLM 2 等模型雖然功能強大,但也有其局限性,例如當缺乏特定領域的數據時,模型可能不夠相關,而且可能無法及時呈現新信息或準確信息。 LLM 在提示(prompts)中可以處理的上下文長度(即詞組數量)有硬性限制,此外,LLM 的訓練或微調需要大量的計算資源,這會使成本劇增。要在這些限制和優勢之間取得平衡,需要進行謹慎的策略和強大基礎設施的支持。

2.高性能的數據層

高效的LLM 應用程序由可擴展的高性能數據層支撐,該組件可確保高速交易和低延遲,這對于保持用戶流暢交互至關重要。它在以下方面發揮關鍵作用:

·緩存預計算的請求響應或嵌入

·對過去的交互歷史進行持久化

·進行語義搜索以檢索相關的上下文或知識

向量數據庫已成為一種流行的數據層解決方案。Redis 在向量搜索方面的投入遠遠早于當下的向量數據庫熱潮,這反映了我們具有豐富的經驗,尤其是在性能方面。Redis對于向量搜索的經驗在剛剛發布的 Redis 7.2 版本中得到了體現,該版本包括可擴展搜索功能預覽,與前一版本相比,每秒查詢次數提高了16倍。

基礎模型和向量數據庫在不同行業的LLM 應用中發揮著至關重要的作用,因此引發了業界的極大興趣和炒作。例如,一些較新的獨立向量數據庫解決方案(如 Pinecone)宣布獲得巨額融資,并投入大量精力以贏得開發人員的關注。然而,由于每周都有新的工具出現,因此很難知道哪款工具真的能滿足企業需求。

GCP (Google’s Google Cloud Platform)的與眾不同之處在于其統一的產品,它將功能強大的基礎模型、可擴展的基礎設施,以及一套用于調整、部署和維護這些模型的工具結合在一起,從而能夠確保最高級別的數據安全和隱私安全。

但是,要真正發揮這些進展的潛力,一個高性能且可擴展的數據層是不可或缺的,這就是Redis的作用所在。

3.可擴展語言模型應用的推理架構
image.png

GCP 和 Redis Enterprise 用于語言模型應用的推理架構

這里所呈現的推理架構適用于通用語言模型用例。它結合使用了Vertex AI(PaLM 2 基礎模型)、BigQuery 和 Redis Enterprise。

GCP 和 Redis Enterprise 用于語言模型應用的推理架構。

您可以按照開源 GitHub 倉庫中的Colab 筆記本逐步設置此 LLM 架構。

1. 安裝庫和工具: 安裝所需的Python 庫,使用 Vertex AI 進行身份驗證,并創建一個 Redis 數據庫。

2. 創建 BigQuery 表格: 將數據集加載到您的GCP 項目中的 BigQuery 表格中。

3. 生成文本嵌入: 循環遍歷數據集中的記錄,使用PaLM 2 嵌入 API 創建文本嵌入。

4. 加載嵌入: 將文本嵌入和一些元數據加載到運行中的Redis 服務器。

5. 創建向量索引 運行Redis 命令來創建一個模式和一個新的索引結構,以實現實時搜索。

完成必要的設置步驟后,這個架構就可以支持多種LLM 應用,如聊天機器人和虛擬購物助手。

二.在語言模型(LLM)應用Redis

即使是經驗豐富的軟件開發人員和應用架構師也可能對這個新的知識領域不了解,這個簡短的總結應該能幫助你迅速掌握要點。

1.利用Redis實現高效可擴展的語義搜索

語義搜索從龐大的知識語料庫中提取語義相似的內容。在這個過程中,知識被轉化為可以進行比較的數值嵌入向量,以找到與用戶查詢最相關的上下文信息。

Redis 作為高性能向量數據庫,擅長索引非結構化數據,從而實現高效可擴展的語義搜索。Redis 可以增強應用程序迅速理解和響應用戶查詢的能力,其強大的搜索索引能力有助于實現響應迅速和準確的用戶交互。

** 2.利用Redis實現檢索增強生成**

檢索增強生成(Retrieval-Augmented Generation,RAG)方法利用語義搜索等方法,在將提示發送到 LLM 之前動態地注入事實知識。這種技術最大程度上減少了在專有或頻繁變動的數據上對 LLM 進行微調的需求。RAG 允許對 LLM 進行上下文增強,使其能夠更好地處理當前的任務,例如回答具體問題、總結檢索內容或生成新內容。

作為向量數據庫和全文搜索引擎,Redis 有助于 RAG 工作流的順暢運行。由于其低延遲的數據檢索能力,Redis 常常是執行此任務的首選工具。它確保語言模型迅速而準確地獲得所需的上下文,促進了人工智能應用高效的執行任務。
image.png檢索增強生成(RAG)架構示例

3.利用Redis實現LLM 的緩存機制

緩存是增強LLM 響應能力和計算效率的強大技術手段。

標準緩存提供了一種機制,用于存儲并快速檢索預生成的常見查詢響應,從而降低計算負載和響應時間。然而,在動態對話背景中使用人類語言時,完全匹配的查詢很少,這就是語義緩存發揮作用的地方。

語義緩存可以理解并利用查詢的潛在語義。語義緩存識別并檢索與輸入查詢在語義上足夠相似的緩存響應。這種能力極大地增加了緩存命中率,進一步改善了響應時間和資源利用率。

例如,在客戶服務場景中,多個用戶可能會使用不同的措辭詢問類似的常見問題。語義緩存使得LLM 能夠在不進行冗余計算的情況下迅速而準確地回應這些問題。image.pngLLM緩存機制

Redis 非常適用于在 LLM 中實現緩存,其強大的功能集包括支持生存時間(TTL)和逐出策略,用于管理臨時數據。結合其向量數據庫的語義搜索能力,Redis 能夠高效快速地檢索緩存響應,從而顯著提升 LLM 的響應速度和系統整體性能,即使在負載較重的情況下也能如此。

4.利用Redis實現內存和持久化

保留過去的互動和會話元數據對于確保上下文連貫和個性化對話至關重要,然而LLM 并沒有自適應記憶,因此依賴一個可靠的系統進行快速的對話數據存儲變得至關重要。

Redis 提供了一個強大的解決方案,用于管理 LLM 的記憶。它可以在大量需求下高效地訪問聊天歷史和會話元數據。Redis使用其數據結構存儲來處理傳統的內存管理,同時其向量數據庫功能有助于提取語義相關的互動內容。

三、LLM 的應用場景

1.文檔檢索

一些企業需要處理大量的文檔,而LLM 應用可以成為文檔發現和檢索的強大工具,語義搜索有助于從廣泛的知識語料庫中精確定位相關信息。

2.虛擬購物助手

LLM 可以支持復雜的電子商務虛擬購物助手,通過上下文理解和語義搜索,它可以理解客戶的問題,提供個性化的產品推薦,甚至實時模擬對話互動。

3.客戶服務助理

將LLM 部署為客戶服務代理可以徹底改變客戶互動方式,除了回答常見問題外,系統還可以進行復雜的對話,為客戶提供定制化的幫助,并從過去的客戶互動中進行學習。

四.Redis 和 Google Cloud:強強聯合

1.基于知識

GCP 和 Redis 讓 LLM 應用不僅僅是先進的文本生成器,通過在運行時迅速注入來自您自己領域的特定知識,它們確保您的應用可以提供基于知識、準確和有價值的交互,特別適應于您的組織知識庫。

2.簡化架構

Redis 不僅僅是一個鍵值數據庫,它是實時數據的多功能工具,通過消除為不同用例管理多個服務的需求,它極大地簡化了您的體系架構。作為許多組織已經信任的緩存和其他需求的工具,Redis 在 LLM 應用中的集成起到了無縫擴展的效果。

3.優化性能

Redis 是低延遲和高吞吐量數據結構的代名詞。當與具有超強計算能力的GCP結合時 ,您將擁有一個不僅智能而且響應迅速的 LLM 應用,即使在負載較重的情況下也能如此。

4.企業級能力

Redis是經過時間驗證的開源數據庫核心,可為全球財富100強公司提供可靠服務。在Redis Enterprise提供的五個九(99.999%)可用性的支持下,并由 GCP 強大的基礎架構提供支持,您可以完全信任其可以完全滿足企業需求。

5.加速上市進程

利用Redis Enterprise,您可以更專注于創建 LLM 應用,而不必費心進行數據庫設置。這種集成的便利性加速了上市進程,為您的組織提供了競爭優勢。

盡管新的向量數據庫和生成式AI 產品可能在市場上引起了很大的關注,但是 GCP 和 Redis 的可靠組合更加值得信任。這些經過時間驗證的解決方案不會很快消失,它們已經準備好為您的 LLM 應用提供動力,無論是今天還是未來的數年。

虹科是Redis原廠的中國區戰略合作伙伴。我們持續關注各行業當下急切需求,專注于為企業解答疑問,制定專屬服務,提供一站式數據庫和商業智能解決方案。了解更多【企業級數據庫解決方案】及【企業緩存指南】,歡迎前往虹科云科技官網!
image.png
虹科云科技 ,主要分享企業級云解決方案,包括云計算、數據庫、商業智能、數據可視化、高性能計算、數據管理、人工智能等相關知識、產品信息、應用案例及行業信息,如Redis Enterprise、Weka、Domo、Visokio、Nimibix等,為學習者傳輸前沿知識、為技術工程師解答專業問題、為企業找到最適合的云解決方案!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31524

    瀏覽量

    270339
  • 語言模型
    +關注

    關注

    0

    文章

    538

    瀏覽量

    10341
  • LLM
    LLM
    +關注

    關注

    0

    文章

    299

    瀏覽量

    400
收藏 人收藏

    評論

    相關推薦

    方案 僅需4個步驟!輕松高效搭建TSN測試網絡

    隨著汽車行業向分層同構以太網網絡的轉型,時間敏感網絡(TSN)逐漸成為實現確定性以太網互操作性的關鍵解決方案。本文將詳細介紹如何快速搭建TSN測試網絡,涵蓋從流量特征分析到網絡配置的全過程,并介紹TSN網絡仿真系統的應用與優
    的頭像 發表于 01-06 11:32 ?134次閱讀
    <b class='flag-5'>虹</b><b class='flag-5'>科</b>方案 僅需4個步驟!輕松高效<b class='flag-5'>搭建</b><b class='flag-5'>虹</b><b class='flag-5'>科</b>TSN測試網絡

    谷歌推出Gemini 2.0 Flash體驗版

    我們正賦予開發者構建 AI 未來的能力,包括尖端模型、智能代碼編寫工具以及跨平臺和設備的無縫集成。自 2023 年 12 月我們推出 Gemini 1.0 以來,數百萬的開發者已經使用 Google
    的頭像 發表于 01-06 09:52 ?240次閱讀

    Google兩款先進生成式AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質的圖像生成模型Imagen 3。近日,我們在 Google Cloud 上進一步推動這一勢頭,客戶可以在
    的頭像 發表于 12-30 09:56 ?143次閱讀

    AI語言模型開發步驟

    開發一個高效、準確的大語言模型是一個復雜且多階段的過程,涉及數據收集與預處理、模型架構設計、訓練與優化、評估與調試等多個環節。接下來,AI部落小編為大家詳細闡述
    的頭像 發表于 12-19 11:29 ?281次閱讀

    搭建開源大語言模型服務的方法

    本文我們將總結5種搭建開源大語言模型服務的方法,每種都附帶詳細的操作步驟,以及各自的優缺點。
    的頭像 發表于 10-29 09:17 ?273次閱讀

    聯發新一代天璣旗艦芯片針對谷歌語言模型Gemini Nano優化

    近日,聯發宣布了一個重要的技術進展——新一代天璣旗艦芯片已經針對谷歌的大語言模型Gemini Nano進行了深度優化。
    的頭像 發表于 10-09 16:44 ?549次閱讀

    谷歌Vertex AI助力企業生成式AI應用

    DeepMind 在模型技術方面積極探索創新,尤其著力于 Gemini 和 Imagen 的改進。我們的企業 AI 平臺 Vertex AI
    的頭像 發表于 09-09 15:59 ?579次閱讀

    谷歌獲Character.AI模型技術授權,創始人重歸谷歌懷抱

    8月5日最新資訊,創新企業Character.AI在上周五正式宣布,他們已經與科技巨頭谷歌的母公司Alphabet達成了一項重要合作,非獨家授權谷歌使用其先進的大型語言
    的頭像 發表于 08-05 14:35 ?490次閱讀

    Al大模型機器人

    金航標kinghelm薩微slkor總經理宋仕強介紹說,薩微Al大模型機器人有哪些的優勢?薩AI
    發表于 07-05 08:52

    谷歌發布新型大語言模型Gemma 2

    在人工智能領域,大語言模型一直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發人員,正式發布了其最新研發的大語言模型——Ge
    的頭像 發表于 06-29 09:48 ?495次閱讀

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    維基百、網頁內容和書籍等,不僅掌握了語言的語法、語義和上下文信息,還能生成結構連貫、語義合理的句子和段落。大語言模型的一個顯著特點是其龐大的參數量,已達數億甚至數十億級別。這種規模賦
    發表于 05-04 23:55

    使用Redis和Spring?Ai構建rag應用程序

    隨著AI技術的不斷進步,開發者面臨著如何有效利用現有工具和技術來加速開發過程的挑戰。Redis與SpringAI的結合為Java開發者提供了一個強大的平臺,以便快速構建并部署響應式AI
    的頭像 發表于 04-29 08:04 ?1115次閱讀
    使用<b class='flag-5'>Redis</b>和Spring?<b class='flag-5'>Ai</b>構建rag應用程序

    谷歌Vertex AI搜索在醫療保健領域正式推出

    谷歌公司近日宣布,其Vertex AI搜索功能在醫療保健領域正式亮相,并已成功與MedLM以及醫療保健數據引擎(HDE)完成集成。這一創新功能專為醫護人員設計,旨在從繁雜的醫療記錄中快速且精準地提取出關鍵的臨床信息。
    的頭像 發表于 03-22 14:08 ?686次閱讀

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以在谷歌的官方網站或相關的開發者平臺上找到。具體地,您可以嘗試訪問谷歌AI
    的頭像 發表于 03-01 18:13 ?1622次閱讀

    谷歌發布輕量級開源人工智能模型Gemma

    谷歌近日宣布推出開源人工智能(AI模型系列Gemma,旨在為開發人員和研究人員提供一個負責任的AI構建平臺。這一舉措標志著自2022年Op
    的頭像 發表于 02-23 11:38 ?930次閱讀
    百家乐官网最佳投注法下载| 永清县| 百家乐官网最好投注法是怎样的去哪儿能了解一下啊 | 网络百家乐必胜投注方法| 百家乐庄闲和各是多少| 网络百家乐官网会作假吗| bet365体育在线投注 jxhymp| 新澳门百家乐官网的玩法技巧和规则| 云鼎百家乐现金网| 缅甸百家乐官网网络赌博解谜 | 百家乐百博| 百家乐类游戏平台| 红宝石百家乐娱乐城| 属猪与属蛇做生意怎么样| 百家乐官网最好的平台是哪个| 爱马仕赌球| 威尼斯人娱乐场内幕| 百家乐只打闲打法| 百家乐庄家抽水| 豪享博百家乐官网的玩法技巧和规则 | 百家乐官网筹码样式| 大发888娱乐城菲律宾| 涂山百家乐的玩法技巧和规则| 千亿娱百家乐官网的玩法技巧和规则 | 水果机遥控器多少钱| 逍遥坊百家乐的玩法技巧和规则| 澳门百家乐有哪些| 百家乐娱乐网站| 在线百家乐官网策略| 伯爵百家乐官网娱乐场| 百家乐官网娱乐城博彩| 凉山| OK娱乐城| 爱赢娱乐城开户| 娱网棋牌下载| 德州扑克小说| 德州扑克3d豪华版| 棋牌中心| 金莎娱乐| 蒙阴县| 百家乐官网网真人真钱群|