同乐城娱乐博彩技巧,赌球网页,足球AG百家乐投注计算(中国)·官方网站

OpenAI Vs Google

目前大模型 top2 應該就是 OpenAI 的 GPT-4，以及谷歌的PALM-2。這兩家公司早已布局，而且技術實力雄厚。國內大模型和 GPT-4 相比，還是有比較大的差距。

但是國內的勢頭目前不錯，百家齊鳴，還沒有一家有絕對的優勢。

讓人頭暈的排名

之前有媒體給出了目前國內Top-5的大模型公司，分別是：百度的文心一言、阿里的通義千問、騰訊的混元、華為的盤古以及360的智腦。

而最近，中文通用大模型基準（SuperCLUE）評測公布了最新結果，GPT-4 遙遙領先，而國內成績最好的是科大訊飛的星火認知大模型。這里面文心一言居然排在了最后一名，甚至比ChatGLM-6B的得分還低，實在難以置信。

但是我又仔細看了一下這個評測。媽呀，評測集是SuperCLUE，而非SuperGLUE。

眾所周知，在國際NLP領域，有大名鼎鼎的數據集 GLUE 和 SuperGLUE，非常權威，OpenAI、谷歌等的大模型都在上面評測，極大推動了 NLP 領域的發展。

這次這份 SuperCLUE 評測的發起方為 Chinese GLUE 組織（簡稱 CLUE），CLUE 是仿照 GLUE由國內民間組織的評測，權威度和影響力與 GLUE 相比差很遠，其微信賬號主體屬性為個人。但這也迷惑了不少圈內人，GLUE和 CLUE 分不清楚，堪稱李逵和李鬼。

還有一點存疑，評測榜單發布當天5月9日，其官網顯示信息，中文基準測評成員顧問中排名第一的是崔一鳴，身份為學術顧問委員會主任，哈工大訊飛聯合實驗室（HFL）資深級研究員。而5月10日，官網已刪除此條顧問的信息。

而001號創始會員徐亮，是會長，相當于這個榜單的實際負責人。昵稱 brightmart，中文任務基準測評發起人。多個預訓練模型中文版、文本分類和數據集開源項目作者。

徐亮還有另一個身份，在5月9日官網中顯示，他是杭州實在智能算法專家，也就是元語智能的創始人，曾在2月份發布自稱“國內首個功能對話大模型ChatYuan”，不僅無法測試，發布幾天即被監管叫停。4月，又被報道套殼推出開源組件。有分析人士認為，不排除創業公司有融資壓力，蹭熱度吸引投資人關注。

該 SpuerClue 榜單發起方，001號顧問是訊飛身份背景、001號基準發起人是創業公司創始人。在榜單發布后，擔心行業質疑其公平、公正，相關信息還被刪除。這就有點不言而喻了。

僅用100道評測題目就出來了一份“權威報告”

最后來說下這個榜單本身，業內人士一眼就可以看出來，評測的很不合理，首先，沒有公布評估數據，以及具體的評估方式。同時從它的公開表述，可推斷總共題目就 100 道題目。這個題目量少到難以置信。專業人士可能有參與過，像國際權威 SuperGlue 榜單，題目一般都得有 2 萬多道，離權威可是差了幾萬倍。況且，它的評測得分榜首都是人類，那這個評分的基準到底是什么？是否有很多主觀性因素在里面？是否某些大模型提前在這個數據集上已經訓練過？

任務設計太武斷，所謂“通用”基準，是用以測試通用的人工認知能力的，那么我們自然希望，評測任務是參考了模型想要模擬的認知能力及相關理論，系統化地選擇出來的。而實際上，我們觀察到的則是，基準的作者們在選擇任務的時候，更像是圖方便、省事。以往，CLUE 中存在著部分數據集，一味考慮任務的復雜性，卻在最起碼的分布邊界劃分上（如NER各個類別的邊界，如場所、景點類，組織機構及其子類），模糊不清，且數據的一致性無法保證。

要么別比，要比就來點正規的比賽。自己出題自己考，說不準還搶跑，自己還是評委，那這是欺不負了解真相的吃瓜群眾。投機取巧，終皆散去。苦練內功，才是王道。

國內大模型排名（僅供參考）

拋開這些，從模型規模、模型效果、市場占有率等多個角度，百度的文心一言、華為的盤古、阿里的通義千問、騰訊的混元排在前四，應該是比較合理的，至于后面的排名，就不大能保證了。不過下面的排名也可以參考一下：

下面是一份完整的名單：

按發布時間排序：

百度：文心一言

作為國內最早發布的大模型，百度的文心一言在今年3月16號就發布了，隨后經過了多個版本的迭代。目前已經有上千家企業接入。文心一言支持圖片、語音等多模態。

3月16日，百度在全球大廠中率先發布對標 ChatGPT 的大模型產品文心一言。據了解，文心一言內測一個多月，就完成了4次大的技術升級，大模型推理性能提升近10倍。

李彥宏在5月4日百度內部活動中表示，百度之所以能夠在Google、Meta、Amazon等大廠之前率先發布生成式大模型產品，是因為百度在芯片、框架、模型、應用等四個層面做到全棧布局、層層領先。

360：360智腦

百度是國內搜索市場排名第一公司，而排名第二就是360。

大模型依靠的算力、數據、算法、場景，這兩家公司都具備，這也是搜索公司的優勢，有業務和數據支撐大模型研發和落地。

5月16日，360集團和智譜AI宣布達成戰略合作，雙方共同研發的千億級大模型“360GLM”已具備新一代認知智能通用模型水準。

而在今天的世界智能大會上，周鴻祎展示了“360智腦”的多輪對話和“360鴻圖”的AI生圖兩個能力。

就像谷歌和微軟，一個擁有谷歌搜索，一個擁有必應。國內的百度和360，一個擁有百度搜索，一個擁有360搜索。

搜索公司應該是這場大模型爭霸賽最后的贏家。（只是個人看法）

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
3313

瀏覽量
49231
GPT

GPT

+關注

關注
0

文章
360

瀏覽量
15506
OpenAI

OpenAI

+關注

關注
9

文章
1140

瀏覽量
6707

原文標題：國內大模型爭霸賽，你最看好哪家？這是你心目中的大模型排名嗎？

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

英諾賽科香港上市，國內氮化鎵半導體第一股誕生

近日，國內氮化鎵功率半導體領域的佼佼者——英諾賽科(蘇州)科技股份有限公司，在香港聯合交易所主板成功掛牌上市。此舉標志著國內氮化鎵半導體第一股正式誕生，為行業樹立了新的里程碑。英諾賽

發表于 01-02 14:36 ?270次閱讀

2024“畫質爭霸賽”落下帷幕，海信電視U8N Pro“最強機皇”實至名歸

2024年的電視行業,可以凝練成四大關鍵詞:“百吋”、“Mini LED”、“AI”和“畫質”。“”Mini LED”電視成為了用戶和行業新寵,“百吋”成為增長速度最快的電視尺寸,“AI”則是自ChatGPT流行以來,嵌入到幾乎各行各業,每一個產品都不可忽略的基礎設施。而“畫質”則是多年不變的,用戶選擇電視時的第一考量因素,畢竟電視就是用來看的,“好看”才是第一要義。因此,在電視行業關于“畫質”水平的競爭從未停止過,各品牌幾乎都祭出了渾身解數去搶占好畫質

發表于 12-31 17:53 ?313次閱讀

2024“畫質<b class='flag-5'>爭霸賽</b>”落下帷幕，海信電視U8N Pro“最強機皇”實至名歸

智慧路燈哪家強？看完這些案例你就心里有數了

發表于 11-14 18:05 ?393次閱讀

智慧路燈<b class='flag-5'>哪家</b>強？看完這些案例<b class='flag-5'>你</b>就心里有數了

第一屆“澎峰云?大模型AI校園應用創新賽完美結束

在大模型人工智能的浪潮中，澎峰科技與中科曙光強強聯合，共同打造了一場大模型AI創新應用盛宴——第一屆“澎峰云?大模型 AI 校園應用創新賽”。這場賽事不僅是技術的較量，更是智慧的火花碰

發表于 11-11 10:59 ?444次閱讀

50萬獎金池！開放原子大賽——第二屆OpenHarmony創新應用挑戰賽正式啟動

基于OpenHarmony4.1及以上版本開展創新應用開發，開發者可自主選擇OpenHarmony創新應用賽題或Cocos游戲創新應用賽題。無論你是天馬行空的創意達人，還是有豐富游戲開發經驗的實力派，都能在此找到專屬競技

發表于 10-24 15:40

GAP！你對AI大模型到底了解多少？

談到 AI 大模型，你最先想到的是什么？很多人首先關心的還是它的商業變現，而非這些技術術語。AI 大模型訓練是一個端到端的復雜系統工程，技術門檻很高，需要強大的算力支撐，尤其是參數量大的模型

發表于 09-07 09:40 ?752次閱讀

【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型（星火大模型、文心一言、豆包、kimi、智譜glm、通義千問）

接入文心一言、通義千問、豆包、智譜glm、kimi等國內的大模型，但由于各家接口和數據格式不一樣，調試驗證會浪費很多時間。因此本篇以聆思CSK6大模型開發板接入為例，分享具體的接入步驟和接入模板，大家

發表于 08-22 10:12

思爾芯賽題正式發布，邀你共戰EDA精英挑戰賽！

賽題發布COMPETITIONRELEASE2024中國研究生創芯大賽·EDA精英挑戰賽（原“集成電路EDA設計精英挑戰賽”）現已正式拉開帷幕。作為核心出題企業之一思爾芯（S2C），已經為你們準備了

發表于 08-03 08:24 ?741次閱讀

基于大模型的仿真系統研究一——三維重建大模型

問題，賽目推出了基于大模型的仿真系統，利用機器學習、深度學習等人工智能技術，不僅推出自動標注大模型、多模態檢測大模型和場景生成大模型等模塊，

發表于 07-30 14:51 ?1814次閱讀

中文大模型測評基準SuperCLUE：商湯日日新5.0，刷新國內最好成績

日前，中文大模型測評基準SuperCLUE發布最新榜單，對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評，結果顯示在SuperCLUE綜合基準上，日日新 5.0表現

發表于 05-21 14:45 ?832次閱讀

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

]?就以“ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您”這樣的主題，開展了一次深度的大語言模型的測評。開放夜現場測評了十幾個國內外大語言

發表于 05-14 17:35 ?704次閱讀

海外被打假，國內狂跟進，文生視頻大模型的產業路應該怎么走？

大模型

腦極體
發布于 :2024年05月11日 14:03:11

國內哪家的FPGA適合初學者

如題，想著手學習FPGA的話，國內哪家的比較好，更適合初學者學習？這方面的經驗，是一點都沒。

發表于 04-14 19:17

新品爭霸賽：AI加持、屏幕升級，手表、手環還有哪些新花樣

電子發燒友網報道（文/莫婷婷）今年開年至今，可穿戴設備市場上已經推出了不少新品，僅僅是智能腕帶就已經有多家廠商面向國內以及海外市場召開發布會，包括榮耀、OPPO、三星。電子發燒友網整理了智能

發表于 03-26 09:10 ?3332次閱讀

開放原子開源大賽—基于OpenHarmony的團結引擎應用開發賽正式啟動！

“基于OpenHarmony的團結引擎應用開發賽”是開放原子全球開源大賽下開設的新興及應用賽的賽題之一，本次賽題旨在鼓勵更多開發者基于OpenHarmony 4.x版本，使用Unity

發表于 03-13 10:45

吴忠躺衫网络科技有限公司

搜索歷史

國內大模型爭霸賽，你最看好哪家？

評論

英諾賽科香港上市，國內氮化鎵半導體第一股誕生

2024“畫質爭霸賽”落下帷幕，海信電視U8N Pro“最強機皇”實至名歸

智慧路燈哪家強？看完這些案例你就心里有數了

第一屆“澎峰云?大模型AI校園應用創新賽完美結束

50萬獎金池！開放原子大賽——第二屆OpenHarmony創新應用挑戰賽正式啟動

GAP！你對AI大模型到底了解多少？

【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型（星火大模型、文心一言、豆包、kimi、智譜glm、通義千問）

思爾芯賽題正式發布，邀你共戰EDA精英挑戰賽！

基于大模型的仿真系統研究一——三維重建大模型

中文大模型測評基準SuperCLUE：商湯日日新5.0，刷新國內最好成績

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

海外被打假，國內狂跟進，文生視頻大模型的產業路應該怎么走？

國內哪家的FPGA適合初學者

新品爭霸賽：AI加持、屏幕升級，手表、手環還有哪些新花樣

開放原子開源大賽—基于OpenHarmony的團結引擎應用開發賽正式啟動！