吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI初創企業推MoE混合專家模型架構新品abab 6.5

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-04-17 15:06 ? 次閱讀

4 月 17 日,國內人工智能初創公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構的 losoev 6.5 系列模型,其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型:

losoev 6.5:擁有萬億級別的參數,可處理 200k tokens 的上下文長度;

losoev 6.5s:與 losoev 6.5 共享相同的訓練技術和數據,但效率更高,同樣支持 200k tokens 的上下文長度,且能夠在 1 秒鐘內處理近 3 萬字的文本。

自今年 1 月份推出國內首款基于 MoE 架構的 losoev 6 模型以來,MiniMax 通過優化模型架構、重建數據管道、改進訓練算法以及實施并行訓練策略等手段,在加速模型擴展方面取得了顯著進展。

在 200k token 的范圍內,官方對 losoev 6.5 進行了業內常見的“大海撈針”測試,即將一句與原文無關的句子插入長文本中,然后通過自然語言詢問模型,觀察其能否準確識別出這句話。經過 891 次測試,losoev 6.5 均能準確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應用于 MiniMax 旗下的產品,如海螺 AI 和 MiniMax 開放平臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93354
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240282
  • 模型
    +關注

    關注

    1

    文章

    3305

    瀏覽量

    49220
收藏 人收藏

    評論

    相關推薦

    法國AI初創企業Mistral AI計劃IPO

    法國AI領域的初創企業Mistral AI近日宣布了其未來的發展藍圖。公司創始人兼首席執行官Arthur Mensch明確表示,Mistral AI
    的頭像 發表于 01-24 13:58 ?219次閱讀

    企業AI模型托管怎么做的

    當下,越來越多的企業選擇將AI模型托管給專業的第三方平臺,以實現高效、靈活和安全的模型運行。下面,AI部落小編為您介紹
    的頭像 發表于 01-15 10:10 ?76次閱讀

    企業AI模型部署攻略

    當下,越來越多的企業開始探索和實施AI模型,以提升業務效率和競爭力。然而,AI模型的部署并非易事,需要
    的頭像 發表于 12-23 10:31 ?171次閱讀

    獵戶星空發布Orion-MoE 8×7B大模型AI數據寶AirDS

    。 Orion-MoE 8×7B是獵戶星空精心打造的開源混合架構專家模型,該模型擁有高達8×7
    的頭像 發表于 11-29 13:57 ?304次閱讀

    騰訊發布開源MoE大語言模型Hunyuan-Large

    近日,騰訊公司宣布成功推出業界領先的開源MoE(Mixture of Experts,專家混合)大語言模型——Hunyuan-Large。這款模型
    的頭像 發表于 11-06 10:57 ?371次閱讀

    昆侖萬維開源2千億稀疏大模型Skywork-MoE

    近日,昆侖萬維公司宣布開源一款名為Skywork-MoE的稀疏大模型,該模型擁有高達2千億參數,不僅性能強勁,而且推理成本更低,為人工智能領域帶來了新的突破。
    的頭像 發表于 06-04 14:44 ?621次閱讀

    浪潮信息發布“源2.0-M32”開源大模型

    浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎上,引入了“基于注意力機制的門控網絡”技術,構建了一個包含32個專家混合
    的頭像 發表于 05-29 09:08 ?722次閱讀

    騰訊云大模型價格調整:混元-lite、混元-standard免費,混元-pro降價

    據了解,騰訊混元大模型是騰訊全鏈路自研的萬億參數大模型,采用混合專家模型MoE)結構,
    的頭像 發表于 05-23 17:05 ?1055次閱讀

    人大系初創公司智子引擎發布全新多模態大模型Awaker 1.0

    人大系初創公司智子引擎近日震撼發布了新一代多模態大模型Awaker 1.0,這一里程碑式的成果標志著公司在通用人工智能(AGI)領域取得了重要突破。與前代ChatImg序列模型相比,Awaker 1.0憑借其獨特的
    的頭像 發表于 05-06 09:59 ?666次閱讀

    MOE與MOT:提升LLM效能的關鍵策略比較

    MoE 與 MoT:在專家混合中(左),每個令牌都被路由到不同的專家前饋層。在令牌混合(右)中,每組內的令牌被
    的頭像 發表于 04-15 09:53 ?972次閱讀
    <b class='flag-5'>MOE</b>與MOT:提升LLM效能的關鍵策略比較

    AI初創企業Suno發布首款音樂AI生成模型SunoV3

    美國人工智能初創企業Suno近日震撼發布其首款音樂AI生成模型——SunoV3。這款創新產品已正式登陸其官方網站,并向所有用戶免費開放使用,標志著音樂創作領域邁入了全新的智能化時代。
    的頭像 發表于 03-26 09:17 ?1208次閱讀

    英特爾與Arm聯手助力初創企業開發Arm架構SoC

    據介紹,此次合作旨在聯合推動使用Intel 18A制程工藝研發Arm架構SoC的初創企業發展。英特爾和Arm將攜手提供IP和制造及相關金融支持,助力初創
    的頭像 發表于 03-25 15:34 ?470次閱讀

    微軟支付6.5億美元獲得Inflection AIAI模型授權

    微軟近日宣布向人工智能初創公司Inflection AI支付高達6.5億美元的巨額資金,這一舉動在業內引起了廣泛關注。據悉,這筆資金主要用于獲得Inflection AI
    的頭像 發表于 03-25 10:39 ?544次閱讀

    蘋果發布300億參數MM1多模態大模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的多模態大模型研究成果——MM1。這款具有高達300億參數的多模態模型系列,由密集模型
    的頭像 發表于 03-19 11:19 ?954次閱讀

    微軟攜手法國AI初創企業Mistral推動AI模型商業化

    微軟近日與法國人工智能初創企業Mistral達成合作協議,旨在推動AI模型的商業化應用。據悉,微軟將提供全方位支持,幫助這家成立僅10個月的公司將其先進的
    的頭像 發表于 02-28 10:23 ?615次閱讀
    百家乐官网赌博程序| 捷豹百家乐官网娱乐城| 做生意门面对着什么方向好| 百家乐官网赌博千术| 刀把状的房子做生意| 百家乐路单| 大发888网址怎么找| 百家乐官网游戏策略| 金字塔百家乐官网的玩法技巧和规则 | 百家乐官网如何制| 百家乐大路小路三珠路| 博彩网皇冠| 至尊百家乐官网奇热| 澳门百家乐公试打法| qq德州扑克官网| 百家乐官网概率统计| 百家乐论坛香港马会| KTV百家乐的玩法技巧和规则 | 武乡县| 都江堰市| 百家乐平台开发| 莆田棋牌游戏下载| 百家乐官网搏牌| 百家乐赌场彩| 汕头市| 百家乐游戏开发技术| 太阳城娱乐城88| 澳门百家乐官网官网网站| 百家乐那里最好| 最好的百家乐官网好评平台都有哪些| 做生意风水门面要求| 英皇娱乐| 百家乐官网群的微博| bet365地址| 三公百家乐官网在哪里可以玩| 现金二八杠游戏| 粤港澳百家乐官网娱乐场| tt百家乐的玩法技巧和规则 | 什么百家乐官网九宫三路| 全讯网信息| 百家乐官网新送彩金|