吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型時代的AI之變與開發之根

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2021-09-29 08:54 ? 次閱讀

自2018年谷歌發布Bert以來,預訓練大模型以強大的算法效果,席卷了NLP為代表的各大AI榜單與測試數據集。隨著產學研各界的深入研究,大模型在AI產學研各界的地位得到不斷加強。到2021年,我們可以看到各大學術機構、科技企業都在打造自己的大模型,并且將其能力邊界、技術路徑進行了極大拓展。

有人認為,AI大模型的到來讓這項技術完成了從實驗室到工業化集成的轉變。如果說過去的AI開發需要手工作坊模式的調參、調優、數據積累,那么大模型則預先集成了海量數據的訓練效果,企業與科研用戶拿到手中就是一個“智力”強大、效果客觀的完成品。于是極大程度節省了重復開發成本,降低了開發門檻。

大模型的價值涌現出來,下一個問題隨之誕生:打造大模型需要人工智能算力、網絡、框架等一系列條件形成有效支撐,才能讓大模型真正“大”起來。大模型能夠持續發展的前提,是必須打造強壯的AI根技術,在框架、算力等層面滿足大模型的“建造”需求。

不久之前,中科院自動化所發布了全球首個三模態大模型——紫東.太初。

而這項技術成果的背后,是中科院自動化所與華為攜手,利用全場景AI框架MindSpore對大模型開發進行了一系列支撐。9月25日, 在華為全聯接2021上,MindSpore中文名“昇思”發布,同時推出昇思1.5版本。這一版本強化全場景能力、原生支持大模型,并新增AI科學計算新范式,發布電磁仿真套件和分子模擬套件,促進AI應用于科學計算領域。

ec8d5bc6dd014e8fbc2a29c104c8137c~tplv-tt-shrink:640:0.image

我們就借此機會,聊聊大模型如何從昇思1.5中汲取營養;持續打造大模型,需要開發框架帶來怎樣的根技術支持。

時代的召喚:大模型推動AI之變

預訓練大模型發展到今天,已經經歷了三年多的時間。期間最具“出圈”效應的大模型,可能就要屬2020年OpenAI發布的NLP大模型GPT-3。

GPT-3首次實現了千億級數據參數,除了傳統的NLP能力之外,還可以算術、編程、寫小說、寫論文摘要,一時之間成為輿論熱點。GPT-3的出現,讓各界看到了大模型的潛力, 也讓中國開發自己的大模型成為了“時代的召喚”。

從產業價值上看,預訓練大模型帶來了一系列可能性,讓產學研各界看到了由弱人工智能走向強人工智能;由重復開發、手工作坊式人工智能,走向工業化、集成化智能的全新路徑。可以說,大模型是近兩年AI持續變革的核心動力,也是AI走入千行百業、各學科領域的關鍵支柱。

于是我們可以看到,中國的科技企業、學術科研機構紛紛開始加碼大模型,并且在不同路徑上進行探索和嘗試。比如說,Bert和GPT都是NLP領域的大模型,缺乏對圖形圖像數據與多模態數據的處理能力。因此,多模態大模型成為了重要的研究方向。集成語音、文本、圖像、視頻等各個模態信息的處理模式,也更加貼近人類感知,具有更高的社會價值。

對于產學各界來說,數據量大、訓練效果好、網絡拓撲結構緊湊,同時又容易獲取的預訓練大模型,都是未來學術研究、AI開發、產業升級的基礎和關鍵。大模型將很有可能改變AI的研究范式,成為不同領域的共性基礎平臺。

中科院自動化所就瞄準這一方向,成功構建了視覺-文本-語音三模態預訓練模型——紫東.太初。而在其背后,華為提供的昇思1.5框架的能力,成為了打造大模型的利劍。

駛向多模態:紫東.太初的獨特價值

破混沌,開新局,紫東.太初這個極具魄力與東方文化質感的名字屬于全球首個三模態大模型(OPT-Omni-Perception pre Trainer)。它能夠實現圖文音語義的統一表達,將視覺、文本、語音三種模態統一起來,實現以文搜圖,以圖生音等跨模特理解與生成能力,這標志著預訓練模型工作獲得突破性進展。

目前階段,產學研界最多的大模型就是NLP大模型,其次是CV大模型。而多模態大模型作為新生事物,基本也考慮的是兩個模態之間的協同轉化。比如圖像與文本、視頻與文本,并且能力更多是集中在生成或理解中的一項,很少能夠兼顧。

紫東.太初為了解決這些問題,提出了視覺-文本-語音三模態預訓練模型。通過將視覺、文本、語音不同模態數據各自編碼器,映射到統一語義空間,然后通過多頭自注意力機制(Multi-head Self-attention)學習模態之間的語義關聯以及特征對齊,形成多模態統一知識表示,再利用編碼后的多模態特征,最終通過解碼器分別生成文本、圖像和語音。經過這樣的對齊與轉化,大模型可以更加關注圖-文-音三模態數據之間的關聯特性以及跨模態轉換問題,對更廣泛、更多樣的下游任務提供模型基礎支撐。最終,多模態大模型不僅可以實現跨模態理解,還能完成跨模態生成,極大程度提升了學習框架的靈活性,有效降低了多模態數據的收集與清洗成本。

由于三模態大模型非常接近人類的信息處理方式,其對信息數據有非常好的協同掌握能力,因此可以非常廣泛地應用于產學各領域,孵化出更多新應用。紫東.太初目前已經具備全球領先的圖文音跨模態理解與生成能力,可輕松完成智能問答、圖片生成、視頻理解與等任務,這些能力將在工業質檢、影視創作、互聯網推薦、智能駕駛等領域廣泛應用。

而面向產業上游看,我們會發現紫東.太初的打造,得益于昇騰AI的產業底座。尤其是昇思對大模型的原生支持,讓大模型具備了快速開發、精準訓練的“開發之根”。

根強則AI強:昇思支持大模型時代到來

在MindSpore 全新升級的1.5版本中,我們不僅見到了全新的中文名——昇思,更重要的是見到了昇思新版本對科學研究、AI基礎開發的全新適配能力,展現了昇騰AI產業對新銳產學動向的洞察和滿足。

在科研工作中,AI開發經常是一件成本巨大、容錯率極低的工作。算力、數據、基礎模型和開發套件都會成為科研工作中的AI開發難題。面對這些問題,昇思1.5不僅極大提升了對大模型的適配能力,還強化升級了科學計算引擎,全面加強了對學術界、工業界的AI開發支持。

在大模型支持方面,昇思1.5版本實現了原生支持大模型,能夠在業界率先支持全自動并行AI處理。在大模型訓練中,可以同時使用數據并行、算子級模型并行、Pipeline 模型并行、優化器模型并行、異構并行、重計算、高效內存復用多維度、全種類的分布式并行策略;并且原創集群拓撲感知的多維度自動混合并行,實現超大模型自動切分,顯著提升集群加速能力;新的 DNN分布式并行編程范式,可以實現低代碼算法切換,大幅節省開發時間。

面對結構復雜、訓練開銷巨大、訓練時間漫長的多模態大模型,新的昇思特性可以極大提升訓練加速能力,同時減少系統性能優化代價,降低代碼開發工作力,從而綜合性地減少調試與訓練周期。

在這樣的框架能力升級中,會有更多創新性強、訓練數據規模大的預訓練大模型在昇思的支撐下發展起來。昇思自然也就名副其實成為了大模型的“根技術”。

目前,基于昇思訓練的大模型除了已經發布的全球首個中文預訓練大模型鵬程.盤古、全球首個三模型預訓練大模型紫東.太初,還有即將發布的智能遙感大模型、語音大模型等等,可以說昇思框架對大模型支持的能力是業界首屈一指的。

6aa0ef0f6c7a40188761646619ef7091~tplv-tt-shrink:640:0.image

與此同時,昇思1.5還新增了對外開放機制等諸多新特性,尤其注重在科研創新和應用領域的支持。通過多尺度混合計算和高階混合微分兩大關鍵創新,將原有的 AI 計算引擎升級為 AI 與科學計算的統一引擎,實現融合的統一加速。在此基礎上,未來昇思將面向 8 大科學計算場景推出 MindScience 系列套件??茖W計算套件包含業界領先的數據集、基礎模型、預置高精度模型和前后處理工具,可以加速科學行業應用開發。

昇思將持續加強對科研領域AI開發的支持,尤其是為大模型這種“國之重器”的訓練底座。同時,昇騰社區和昇思MindSpore社區也會加強對大模型開源開放的支持。目前,昇思社區下載量已經突破60萬,社區貢獻者超過3500人。昇思正在與產學研各界一同推進開源開放,讓大模型真正成為科學之基、產業之本。

預訓練大模型正在推動一場AI新變革。而在關注這場變革之前,我們更應該關注根技術、根平臺的打造與建設。

堅實的產業基礎之上,才能產學各界萬花盛放。AI大模型之變,應該有強壯的根。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93356
  • AI
    AI
    +關注

    關注

    87

    文章

    31520

    瀏覽量

    270335
  • 模型
    +關注

    關注

    1

    文章

    3309

    瀏覽量

    49224
  • 大數據
    +關注

    關注

    64

    文章

    8908

    瀏覽量

    137794
收藏 人收藏

    評論

    相關推薦

    NVIDIA推出加速物理AI開發的Cosmos世界基礎模型

    經數百萬小時的駕駛和機器人視頻數據訓練的先進模型,可用于普及物理 AI 開發,并以開放模型許可形式提供。
    的頭像 發表于 01-09 11:05 ?288次閱讀

    AI大語言模型開發步驟

    開發一個高效、準確的大語言模型是一個復雜且多階段的過程,涉及數據收集與預處理、模型架構設計、訓練與優化、評估與調試等多個環節。接下來,AI部落小編為大家詳細闡述
    的頭像 發表于 12-19 11:29 ?281次閱讀

    大語言模型開發框架是什么

    大語言模型開發框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言模型
    的頭像 發表于 12-06 10:28 ?181次閱讀

    名單公布!【書籍評測活動NO.49】大模型啟示錄:一本AI應用百科全書

    一次大模型變革中,完全不缺態度,只缺認知與落地的經驗。 在過去的兩年中,我們看到了全球太多的巨頭和普通中小企業,進入All in AI的投資周期。有的已經開始落地到具體的生產流程,例如企業內部客服、優化
    發表于 10-28 15:34

    常見AI模型的比較與選擇指南

    :由月暗面科技有限公司開發,擅長中英文對話,能處理多種文件格式(TXT、PDF、Word、PPT、Excel等),還能閱讀和理解用戶上傳的文件,并結合互聯網搜索結果來回答問題。 智普清言(智譜清言) :基于智譜AI自主研發的
    的頭像 發表于 10-23 15:36 ?1176次閱讀

    【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受

    國慶前就收到《大模型時代的基礎架構》一書,感謝電子發燒友論壇。歡度國慶之余,今天才靜下心來體驗此書,書不厚,200余頁,彩色圖例,印刷精美! 當初申請此書,主要是看到副標題“大模型算力中心建設指南
    發表于 10-08 10:40

    模型時代的算力需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型的算力,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問
    發表于 08-20 09:04

    AI模型AI框架的關系

    多個領域取得顯著成果。而AI框架則是為開發和訓練AI模型提供的一套標準接口、特性庫和工具包,它集成了算法的封裝、數據的調用以及計算資源的使用,是AI
    的頭像 發表于 07-15 11:42 ?1261次閱讀

    聆思CSK6視覺語音大模型AI開發板入門資源合集(硬件資料、大模型語音/多模態交互/英語評測SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯 視覺語音大模型 AI 開發套件( CSK6-MIX )是圍繞 CSK6011A 芯片設計的具備豐富語音圖像功能
    發表于 06-18 17:33

    2024 TUYA全球開發者大會盛大啟幕,Cube AI模型重磅首發!

    AI浪潮席卷全球的當下,把握時代脈搏,全面擁抱生成式AI已成為共識。面對AI帶來的無限可能,開發者們紛紛投身其中,積極探尋
    的頭像 發表于 05-31 08:15 ?412次閱讀
    2024 TUYA全球<b class='flag-5'>開發</b>者大會盛大啟幕,Cube <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>重磅首發!

    2024 TUYA全球開發者大會盛大啟幕,Cube AI模型重磅首發!

    AI浪潮席卷全球的當下,把握時代脈搏,全面擁抱生成式AI已成為共識。面對AI帶來的無限可能,開發者們紛紛投身其中,積極探尋
    發表于 05-30 09:13 ?248次閱讀
    2024 TUYA全球<b class='flag-5'>開發</b>者大會盛大啟幕,Cube <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>重磅首發!

    STM CUBE AI錯誤導入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發表于 05-27 07:15

    AI時代怎么樣不被淘汰?訊飛AI鼠標助力你在AI時代成長

    功能的智能鼠標,將成為你躋身AI時代的利器。 下面來聊聊訊飛AI鼠標都有哪些令人驚艷的AI功能吧 1.星火認知大模型
    的頭像 發表于 03-23 11:41 ?758次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>時代</b>怎么樣不被淘汰?訊飛<b class='flag-5'>AI</b>鼠標助力你在<b class='flag-5'>AI</b><b class='flag-5'>時代</b>成長

    防止AI模型被黑客病毒入侵控制(原創)聆思大模型AI開發套件評測4

    在設計防止AI模型被黑客病毒入侵時,需要考慮到復雜的加密和解密算法以及模型的實現細節,首先需要了解模型的結構和實現細節。 以下是我使用Python和TensorFlow 2.x實現
    發表于 03-19 11:18

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發表于 03-14 07:09
    吕百家乐赢钱律| 明珠百家乐的玩法技巧和规则 | 轮盘必胜法| 百家乐官网电脑游戏机投注法实例| 百家乐路单下注| 百家乐园选| 百家乐官网游戏免费| 葡京百家乐官网的玩法技巧和规则 | 百家乐盛大娱乐城城| 游戏百家乐官网的玩法技巧和规则 | 优博注册| 电脑赌百家乐官网可靠吗| 百家乐输了100万| 德州扑克冠军| 真人百家乐官网娱乐场| 百家乐官网一年诈骗多少钱| 棋牌百家乐程序破解| 现金百家乐游戏| 百家乐官网趋势图怎么看| 百家乐视频软件下载| 亿乐棋牌游戏大厅| 缅甸百家乐官网赌博现场下载| 百家乐下路教学| 博彩排名| 百家乐官网园选蒙| 大发888网站是多少呢| 百家乐官网赌博现金网| 百家乐电子路单谁| 邢台市| 百家乐开户送彩网址| 鼎盛娱乐城开户| 加多宝百家乐官网的玩法技巧和规则 | 黄金城娱乐场| 百家乐辅助工具| bet365备用网址器| 网上百家乐官网赌场娱乐网规则| 威尼斯人娱乐城活动| 百家乐官网赌场导航| 威尼斯人娱乐城老品牌lm0| 百家乐官网园鼎盛娱乐场| 百家乐投资|