吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產AI卷翻硅谷,奧特曼發文“陰陽”,類o1模型都在卷什么?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-01-22 15:13 ? 次閱讀


wKgZPGeQmpiAKapyAAo08dZqdN8157.jpg

兩個國產推理模型的發布,讓全球AI圈“提前過年”了。

前兩天,月之暗面推出了Kimi k1.5多模態思考模型,DeepSeek也發布了DeepSeek-R1文本推理模型,二者都在推理能力上對標OpenAI正式版o1。

wKgZO2eQmpiANTvSAAJ5UfXpNgk813.jpg

不到兩個月,國產推理模型就實現了對OpenAI o1滿血版(2024年12月上線)的對標,而且與OpenAI藏著掖著的技術秘訣不同,兩家中國公司雙雙公開了他們的特色技術道理:DeepSeek R1的極高性價比,kimi k1.5原創技術long2short 高效思維鏈+原生多模態。

因此Kimi/DeepSeek“雙子星”一夜卷翻硅谷,技術報告paper一放出,就吸引了大量海內外同行的關注和解讀,在github的熱度飆升。

wKgZPGeQmpmAenUuAAMTznBqob8800.jpg

目前來看,海外同行的反饋以振奮為主流。比如Answera公司的創始人保羅·庫弗特(Paul Couvert)就感嘆,兩款中國o1同日發布,(中國AI)追趕速度越來越快了!

wKgZO2eQmpmASPRGAAC88xw11c4242.jpg

當然,自然也少不了“潑冷水”的。

OpenAI CEO奧特曼在社交媒體說,“twitter hype is out of control”(推特上的各種炒作已經失控了)。他認為外界猜測的“AI即將取代大部分中層崗位”(主要靠推理模型)過度夸大了。希望大家冷靜下來,把期待值降低100倍(cut your expectations 100x)。

wKgZPGeQmpmAV3HNAADRGz682DY446.jpg

或許有人好奇,國產推理模型真的崛起了嗎?大模型技術如何從“規模擴展”發展到“推理擴展”?對于推理模型這個路線,我們到底該保持興奮還是冷靜一下?本文就來給大家一一解讀。

wKgZO2eQmpmAXXSvAAJhTxIzvKU414.jpg

兩個中國AI公司的新模型,吸引了全球海內外同行的高度關注。原因很簡單,推理模型太火了。

2024年第四季度,出現了reasoning model的新形態LLM,采用思維鏈進行“慢思考”,在推理階段投入更多計算(推理拓展思路),這種創新帶給大模型超前的推理能力,可以減少幻覺,提高可靠性,處理更為復雜的任務,達到人類專家/研究生級別的智能,被認為是規模拓展Scaling Law撞墻后最具潛力的新技術。

o1系列之后,頭部模廠都開始向“慢思考”的推理模型技術路線投入,包括大廠谷歌、百度、阿里、科大訊飛、夸克,以及AI六小虎中的智譜、DeepSeek、階躍星辰等,此前也都推出過準o1的推理模型,但一直沒有全面對標正式版o1的國產推理模型。

要證明國產推理模型的崛起,有兩個前提條件:一是經得起全球同行的審視;二是具備原創能力而非簡單跟隨,全面對標而非部分達標。

目前來看,Kimi k1.5/ DeepSeeK R1達到了上述條件。

Kimi k1.5/ DeepSeeK R1首次真正對標了正式版o1,取得了SOTA成績。其中,k1.5還是國內首個多模態o1,同時支持文本和圖像推理。這在全球推理模型領域都是比較亮眼的成績。

而且,不同于OpenAI o1藏著掖著的風格,Kimi和DeepSeeK都發布了詳細的技術報告,分享模型訓練技術的探索經驗,立刻在海外AI圈掀起了解讀論文的熱潮。

比如英偉達的研究科學家第一時間開扒,得出的結論是,Kimi和DeepSeeK的研究“振奮人心”。

wKgZO2eQmpqAT9_dAATANVjp7gg865.jpg

作為當前AI領域最主流的敘事和技術高地,推理模型的風吹草動,都會引發全球從業者的目光。而中國公司一口氣在推理模型賽道上,拿出兩個重磅論文,模型含金量高,經過了目光聚焦且嚴苛的審視,其中還包含很多原創技術。

可以說,從Kimi k1.5/ DeepSeeK R1的“雙子星”開始,國產推理模型是真的崛起了。

wKgZPGeQmpuAT3hTAAIeIkxZ94c387.jpg

推理模型,國內AI公司是怎么追趕的?我們和海外AI圈一起“黑著眼眶熬著夜”,苦讀kimi/ DeepSeek論文,簡單總結一下:

總路線上,k1.5和R1都使用了強化學習(RL)技術,來提升模型推理能力。但在技術細節上,kimi/ DeepSeek都拿出了全新的思路。

DeepSeek沒有采用業界普遍的監督微調(SFT)作為冷啟動的方案,提出了一種多階段循環的訓練方式,用少量冷啟動數據,微調模型作為強化學習的起點,然后在RL環境中通過獎勵信號來自我進化,實現了非常好的推理效果。

wKgZO2eQmpuADpKdAAF57nQqY5Q343.jpg

Kimi k1.5則首創了long2short思維鏈,讓LLM通過獎勵機制進行探索性學習,自主擴展訓練數據,來擴展上下文長度,從而優化RL訓練表現,在短鏈思維推理方面取得了SOTA成績。

wKgZPGeQmpuAOk_OAAD0TqoLUJU889.jpg

性能最強的long-CoT版本Kimi k1.5,數學、代碼、多模態推理能力可以達到長思考SOTA模型OpenAI o1正式版的水平。

基于long-CoT版本簡化的short-CoT,性能依舊強悍,但推理更加高效,大幅超越了全球范圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領先達到550%。

wKgZO2eQmpyAK9Q7AAMacTAKeLQ950.jpg

除此之外,兩大國產推理模型還各有亮點。

DeepSeek-R1延續了“AI界拼多多”的優秀傳統,API每百萬輸出tokens 16 元,與o1每百萬輸出tokens 60美元的定價一比,性價比拉滿。

Kimi k1.5則是OpenAI之外,首個達到o1多模態推理性能的模型,k1.5支持文本、圖像交疊的多模態輸入,可以進行聯合推理,填補了國內多模態思考模型的空白。

在人類的感官中,視覺信息占比超過70%,有了多模態能力,認識自家的Benchmark圖表自然不在話下。

wKgZPGeQmpyAAvMhAAEI_F45ROk785.jpg

眾所周知,o1要么用起來貴(200美元每月的訂閱費),要么根本用不上(OpenAI不向國內提供服務)。因此,國產推理模型的上述亮點,帶給海內外AI開發者的價值不是一般大,很多開發者都倍感興奮。

一位開發者在論壇感嘆,這兩個中國實驗室“用更少的資源做更多的事情,他們對模型效率和精煉的巨大關注,造福我們所有人”。

wKgZO2eQmp2AL5PvAAKefnTCxE0115.jpg

Amarok開發者Mark Kretschmann也在社交媒體上不吝褒獎,直呼k1.5是“多模態AI領域的重大突破”。

wKgZPGeQmp2ATWrbAAI9pWY7GI4862.jpg

可以看到,面對“推理拓展”這個全新技術領域,中國AI“雙子星”靠原創硬實力穩穩拿下,并走出了一條有別于OpenAI的發展創新之路。

wKgZO2eQmp6AWiFNAAJfFGCmWfY334.jpg

OpenAI奧特曼建議大家放低預期,那么,中國AI公司發力推理模型,價值究竟有沒有、有多大?

對于中國AI公司來說,點亮推理模型的技術版圖,有兩方面的意義:

一是仰望星空,可以拉近中美AI的技術距離。大模型的領先不會從天上掉下來,而是日拱一卒、水滴石穿的努力,保持對最新技術路線的跟進,能讓中國AI的水平快速提高。對標ChatGPT用了半年左右,而對標正式版o1只用了不到三個月,

以Kimi為例,去年11月推出k0-math數學模型,12月發布k1視覺思考模型,今年1月發布k1.5多模態思考模型,三個月三次迭代,進化速度極快。說明對天花板技術的貼身跟進,是中國AI最快最好的練兵場。

wKgZPGeQmp6AQNQUAADdwGTdO90078.jpg

二是腳踏實地,中國的行業沃土為國產AI提供了更廣闊的落地場景,推理模型的落地情況會比o1更好。海外AI多以個人消費者為主,o1的主要用例是程序員的代碼助手、數據分析師、個人開發者,普通人上手門檻高。而國產大模型更多面向行業場景,AI改造的業務場景中包含大量容錯率低的嚴肅生產場景,以前的大語言模型很難解決復雜任務,十分需要少幻覺、高可靠的推理模型。所以,國產推理模型的落地也許會更快、更廣。

從這些角度看,在各行各業引入專家級AI的推理模型,加速行業智能化,恐怕仍會由國產AI率先垂范。k1.5、R1等國產推理模型,將在其中貢獻不可或缺的基座價值。Kimi官方也表示,2025會繼續沿著路線圖,加速升級k系列強化學習模型,帶來更多模態、更多領域的能力和更強的通用能力。

所以不出預料的話,我們很快就能用上花錢少、出活好的專家級國產AI了。

中國AI“雙子星”炸開的2025年大模型開局,分外精彩。推理模型作為模廠的下一個分水嶺,誰抓住了國產推理模型的崛起時刻,也就先一步抓住了未來。

wKgZO2eQmp6ASB6UAAHnoM_99I0589.jpg

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31513

    瀏覽量

    270308
  • 硅谷
    +關注

    關注

    1

    文章

    123

    瀏覽量

    16572
  • 模型
    +關注

    關注

    1

    文章

    3305

    瀏覽量

    49217
收藏 人收藏

    評論

    相關推薦

    OpenAI發布o1模型,數理化水平比肩人類博士,國產云端推理芯片的新藍海?

    電子發燒友網報道(文/吳子鵬)9月12日晚,OpenAI正式對外發布一款名為o1的新模型。OpenAI o1的內部代號為“草莓”,具備超強的邏輯推理能力。和傳統大模型不同,OpenAI
    發表于 09-14 00:04 ?1518次閱讀
    OpenAI發布<b class='flag-5'>o1</b>大<b class='flag-5'>模型</b>,數理化水平比肩人類博士,<b class='flag-5'>國產</b>云端推理芯片的新藍海?

    模型進化論:AI產業落地將向何方?

    模型進化論:AI產業落地將向何方?
    的頭像 發表于 01-24 09:28 ?102次閱讀

    對標OpenAI o1,DeepSeek-R1發布

    DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版
    的頭像 發表于 01-22 13:46 ?382次閱讀
    對標OpenAI <b class='flag-5'>o1</b>,DeepSeek-R<b class='flag-5'>1</b>發布

    TMS320C54x DSP CPU和外設參考集,第1

    電子發燒友網站提供《TMS320C54x DSP CPU和外設參考集,第1.pdf》資料免費下載
    發表于 12-30 16:52 ?0次下載
    TMS320C54x DSP CPU和外設參考集,第<b class='flag-5'>1</b><b class='flag-5'>卷</b>

    張力控制變頻收程序方案

    張力控制變頻收程序方案
    發表于 12-24 14:36 ?0次下載

    OpenAI發布o1模型API,成本大幅下降60%

    近日,OpenAI正式推出了備受期待的o1模型API,并對實時API進行了重大升級,引入了WebRTC支持。此次發布的o1模型API相較于之前的預覽版本,不僅在性能上有所提升,更在成本
    的頭像 發表于 12-19 10:31 ?345次閱讀

    ChatGPT新模型o1被曝具備“欺騙”能力

    近日,據報道,ChatGPT新模型o1在訓練和測試過程中展現出了一種令人驚訝的能力——通過“欺騙”來保護自身。 據悉,在面臨被“刪除”的威脅時,o1曾試圖將自己的數據復制到新服務器,并偽裝成更新版
    的頭像 發表于 12-12 09:38 ?403次閱讀

    創建一個5G的邏輯

    要求創建一個5G的邏輯 思路: 1. 物理的設備 2. 將物理設備做成物理 3. 創建組并將物理加入其中 4. 創建邏輯
    的頭像 發表于 12-04 10:31 ?143次閱讀

    昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

    近日,昆侖萬維正式向外界推出了其最新研發的“天工大模型4.0”o1版(Skywork o1)。該系列模型以其獨特的復雜思考推理能力,吸引了眾多業內人士的關注。 據悉,Skywork
    的頭像 發表于 11-28 10:33 ?388次閱讀

    昆侖萬維天工大模型4.0 O1版即將邀測

    昆侖萬維公司近日宣布,其自主研發的天工大模型4.0 O1版(英文名:Skywork O1)將于11月27日正式啟動邀請測試。這款模型是國內首款具備中文邏輯推理能力的
    的頭像 發表于 11-19 17:24 ?599次閱讀

    天工大模型4.0 O1版即將啟動邀測

    昆侖萬維公司近日宣布,其自主研發的“天工大模型4.0 O1版”(Skywork O1)將于2024年11月27日正式啟動邀請測試。這款模型是國內首款具備中文邏輯推理能力的
    的頭像 發表于 11-18 15:08 ?700次閱讀

    聲智科技打造AI匠心之路

    關注度、曝光度、用戶心智占領……此前一份行業數據表示,國產AI正在進行一場以燒錢投放為核心的市場占有率之戰。
    的頭像 發表于 11-08 09:30 ?368次閱讀

    OpenAI o1開辟“慢思考”,國產AI早已集結在CoE“組團”先出發

    模型學會“慢思考”,中國AI并沒有落后于OpenAI
    的頭像 發表于 09-19 11:42 ?1871次閱讀
    OpenAI <b class='flag-5'>o1</b>開辟“慢思考”,<b class='flag-5'>國產</b><b class='flag-5'>AI</b>早已集結在CoE“組團”先出發

    鴻蒙開發文件管理:【@ohos.volumeManager (管理)】

    該模塊提供、磁盤查詢和管理的相關功能:包括查詢信息,對的掛載卸載、對磁盤分區以及的格式化等功能。
    的頭像 發表于 06-14 10:12 ?513次閱讀
    鴻蒙開<b class='flag-5'>發文</b>件管理:【@ohos.volumeManager (<b class='flag-5'>卷</b>管理)】

    服務器數據恢復—存儲中被刪除后重建如何恢復被刪除的數據?

    服務器存儲數據恢復環境: 某品牌FlexStorage P5730服務器存儲,存儲中有一組由24塊硬盤組建的RAID5陣列,包括1塊熱備硬盤。 服務器存儲故障: 存儲中的2個被刪除,刪除之后重建了一個新。需要恢復之
    的頭像 發表于 06-05 11:03 ?733次閱讀
    乐百家娱乐| 百家乐群| 真让百家乐官网游戏开户| 百家乐官网赌博彩| 百家乐棋牌交友| 大发888开户送58| 众发国际娱乐| 迪威百家乐官网娱乐平台| 百家乐代理在线游戏可信吗网上哪家平台信誉好安全 | 沙龙百家乐娱乐| bet365网址器| 圆梦城百家乐官网娱乐城| 百家乐变牌桌| 真龙娱乐| 线上百家乐官网怎么玩| 百家乐庄闲必胜打| 读书| 百家乐赢钱皇冠网| 德州扑克游戏下载| 百家乐官网波音平台导航网| 百家乐官网押注方法| 威斯汀百家乐的玩法技巧和规则| 渭南市| 缅甸百家乐官网玩家吗| 百家乐百战百胜| 百家乐官网注码调整| 百家乐桌台布| 天天乐娱乐| 百家乐官网开闲的几率多大| 大发888娱乐城好吗| 百家乐官网平注赢钱法| 百家乐视频造假| 网上百家乐官网作弊不| 百家乐赌博策略大全| 百家乐官网试用软件| 百家乐赌博论谈| 亳州市| 澳门百家乐现场视频| 百家乐官网没有必胜| 百家乐剁手| 线上百家乐官网开户|