皇冠现金网开户送钱,娱乐城开户送体验金金杯娱乐城,澳門博彩管理(中国)·官方网站

先后和 OpenAI、Meta 牽手推動(dòng)大模型發(fā)展的微軟，也正在加快自家小模型的迭代。就在今天，微軟正式發(fā)布了一個(gè) 27 億參數(shù)的語言模型——Phi-2。這是一種文本到文本的人工智能程序，具有出色的推理和語言理解能力。

同時(shí)，微軟研究院也在官方 X 平臺(tái)上如是說道，“Phi-2 的性能優(yōu)于其他現(xiàn)有的小型語言模型，但它足夠小，可以在筆記本電腦或者移動(dòng)設(shè)備上運(yùn)行”。

Phi-2 的性能真能優(yōu)于大它 25 倍的模型？

對(duì)于Phi-2 的發(fā)布，微軟研究院在官方公告的伊始便直言，Phi-2 的性能可與大它 25 倍的模型相匹配或優(yōu)于。

這也讓人有些尷尬的事，不少網(wǎng)友評(píng)價(jià)道，這豈不是直接把 Google 剛發(fā)的 Gemini 最小型號(hào)的版本給輕松超越了？

那具體情況到底如何？

微軟通過時(shí)下一些如 Big Bench Hard (BBH)、常識(shí)推理（PIQA、WinoGrande、ARC easy 和 Challenge、SIQA）、語言理解（HellaSwag、OpenBookQA、MMLU（5-shot）、 SQuADv2、BoolQ）、數(shù)學(xué)（GSM8k）和編碼（HumanEval）等基準(zhǔn)測(cè)試，將 Phi-2 與 7B 和 13B 參數(shù)的 Mistral 和 Llama-2 進(jìn)行了比較。

最終得出僅擁有 27 億個(gè)參數(shù)的 Phi-2 ，超越了 Mistral 7B 和 Llama-2 7B 以及 13B 模型的性能。值得注意的是，與大它 25 倍的 Llama-2-70B 模型相比，Phi-2 還在多步推理任務(wù)（即編碼和數(shù)學(xué)）上實(shí)現(xiàn)了更好的性能。

此外，如上文所提及的，微軟研究人員也直接在基準(zhǔn)測(cè)試中放上了其與Google 全新發(fā)布的 Gemini Nano 2 正面PK 的結(jié)果，不出所料，Phi-2盡管尺寸較小，但性能還是把Gemini Nano 2 超了。

除了這些基準(zhǔn)之外，研究人員似是在暗諷 Google 前幾日在Gemini 演示視頻中造假一事，因?yàn)楫?dāng)時(shí) Google 稱其即將推出的最大、最強(qiáng)大的新人工智能模型 Gemini Ultra 能夠解決相當(dāng)復(fù)雜的物理問題，并且甚至糾正學(xué)生的錯(cuò)誤。

事實(shí)證明，盡管 Phi-2 的大小可能只是 Gemini Ultra 的一小部分，但它也能夠正確回答問題并使用相同的提示糾正學(xué)生。

微軟的改進(jìn)

Phi-2 小模型之所以有如此亮眼的成績(jī)，微軟研究院在博客中解釋了原因。

一是提升訓(xùn)練數(shù)據(jù)的質(zhì)量。Phi-2 是一個(gè)基于 Transformer 的模型，其目標(biāo)是預(yù)測(cè)下一個(gè)單詞，它在 1.4T 個(gè)詞組上進(jìn)行了訓(xùn)練，這些詞組來自 NLP 和編碼的合成數(shù)據(jù)集和網(wǎng)絡(luò)數(shù)據(jù)集，包括科學(xué)、日常活動(dòng)和心理理論等用于教授模型常識(shí)和推理的內(nèi)容。Phi-2 的訓(xùn)練是在 96 個(gè) A100 GPU 上耗時(shí) 14 天完成的。

其次，微軟使用創(chuàng)新技術(shù)進(jìn)行擴(kuò)展，將其知識(shí)嵌入到 27 億參數(shù) Phi-2 中。

微軟指出，Phi-2 是一個(gè)基礎(chǔ)模型，沒有通過人類反饋強(qiáng)化學(xué)習(xí)（RLHF）進(jìn)行調(diào)整，也沒有經(jīng)過指導(dǎo)性微調(diào)。盡管如此，與經(jīng)過對(duì)齊的現(xiàn)有開源模型相比，微軟觀察到在毒性和偏差方面，Phi-2 有更好的表現(xiàn)。

寫在最后

話說 Phi-2 的發(fā)布的確在小模型的性能上實(shí)現(xiàn)了突破，不過也有媒體發(fā)現(xiàn)它還存在很大的局限性。

因?yàn)楦鶕?jù)微軟研究許可證顯示，其規(guī)定了 Phi -2 只能用于“非商業(yè)、非創(chuàng)收、研究目的”，而不是商業(yè)用途。因此，想要在其之上構(gòu)建產(chǎn)品的企業(yè)就不走運(yùn)了。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3669

瀏覽量
135258
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1140

瀏覽量
6707
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2551

瀏覽量
3172

原文標(biāo)題：只有 27 億參數(shù)，微軟發(fā)布全新 Phi-2 模型！

文章出處：【微信號(hào)：AI科技大本營(yíng)，微信公眾號(hào)：AI科技大本營(yíng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

在算力魔方上本地部署Phi-4模型

智能水平上的一大飛躍。它不僅達(dá)到了之前只有Llama 3.1 405B模型才具備的智能水平，而且還超越了11月發(fā)布的GPT-4o模型。本文我們將分享

發(fā)表于 01-15 11:05 ?103次閱讀

在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

AMD發(fā)布10億參數(shù)開源AI模型OLMo

AMD公司近日宣布了一項(xiàng)重大進(jìn)展，推出了首個(gè)完全開放的10億參數(shù)語言模型系列——AMD OLMo。這一舉措為開發(fā)者和研究人員提供了強(qiáng)大的AI

發(fā)表于 11-12 18:08 ?507次閱讀

在英特爾酷睿Ultra7處理器上優(yōu)化和部署Phi-3-min模型

2024年4月23日，微軟研究院公布Phi-3系列AI大模型，包含三個(gè)版本：mini(3.8B參數(shù))、small(7B

發(fā)表于 08-30 16:58 ?744次閱讀

在英特爾酷睿Ultra7處理器上優(yōu)化和部署<b class='flag-5'>Phi</b>-3-min<b class='flag-5'>模型</b>

中國(guó)石油發(fā)布330億參數(shù)昆侖大模型

中國(guó)石油在近日于北京舉行的成果發(fā)布會(huì)上，震撼發(fā)布了擁有330億參數(shù)的昆侖大模型，標(biāo)志著中國(guó)能源化工行業(yè)正式邁入大

發(fā)表于 08-29 18:10 ?950次閱讀

谷歌發(fā)布新型大語言模型Gemma 2

在人工智能領(lǐng)域，大語言模型一直是研究的熱點(diǎn)。近日，全球科技巨頭谷歌宣布，面向全球研究人員和開發(fā)人員，正式發(fā)布了其最新研發(fā)的大語言

發(fā)表于 06-29 09:48 ?496次閱讀

微軟發(fā)布PhI-3-Vision模型，提升視覺AI效率

Phi-3-vision 是一種小型多模式語言模型（SLM），主要適用于本地人工智能場(chǎng)景。其模型參數(shù)

發(fā)表于 05-28 11:35 ?543次閱讀

微軟發(fā)布視覺型AI新模型：Phi-3-vision

　據(jù)悉，Phi-3-vision 作為微軟 Phi-3 家族的首款多模態(tài)模型，繼承自 Phi-3-mini 的文本理解能力，兼具輕巧便攜特性

發(fā)表于 05-27 15:56 ?555次閱讀

英特爾優(yōu)化AI產(chǎn)品組合，助力微軟Phi-3家族模型

近日，英特爾宣布針對(duì)微軟的Phi-3家族開放模型，成功驗(yàn)證并優(yōu)化了其跨客戶端、邊緣及數(shù)據(jù)中心的AI產(chǎn)品組合。這一重要舉措旨在提供更為靈活和高效的AI解決方案。

發(fā)表于 05-27 11:47 ?707次閱讀

英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

近日，英特爾針對(duì)微軟的多個(gè)Phi-3家族的開放模型，驗(yàn)證并優(yōu)化了其跨客戶端、邊緣和數(shù)據(jù)中心的AI產(chǎn)品組合。

發(fā)表于 05-27 11:15 ?625次閱讀

微軟自研5000億參數(shù)大模型曝光

微軟近日曝光了其內(nèi)部正在秘密研發(fā)的巨型AI模型——MAl-1，這款模型擁有驚人的5000億參數(shù)。據(jù)微軟

發(fā)表于 05-08 09:56 ?491次閱讀

【大語言模型：原理與工程實(shí)踐】大語言模型的應(yīng)用

類任務(wù)上表現(xiàn)出色，甚至在零樣本條件下也能取得良好效果。另一類則需要逐步推理才能完成的任務(wù)，類似于人類的系統(tǒng)2，如數(shù)字推理等。然而，隨著參數(shù)量的增加，大語言

發(fā)表于 05-07 17:21

【大語言模型：原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

特定任務(wù)對(duì)模型進(jìn)行微調(diào)。這種方法的成功不僅是自然語言處理發(fā)展的一個(gè)轉(zhuǎn)折點(diǎn)，還為許多現(xiàn)實(shí)世界的應(yīng)用場(chǎng)帶來了前所未有的性能提升。從廣為人知的GPT到BERT,預(yù)訓(xùn)練的

發(fā)表于 05-05 12:17

【大語言模型：原理與工程實(shí)踐】揭開大語言模型的面紗

維基百科、網(wǎng)頁內(nèi)容和書籍等，不僅掌握了語言的語法、語義和上下文信息，還能生成結(jié)構(gòu)連貫、語義合理的句子和段落。大語言模型的一個(gè)顯著特點(diǎn)是其龐大

發(fā)表于 05-04 23:55

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一

發(fā)表于 04-28 10:36 ?637次閱讀

微軟發(fā)布phi-3AI模型，性能超越GPT-3.5

微軟稱，帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬億token的強(qiáng)化學(xué)習(xí)，其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5；此外，該

發(fā)表于 04-23 14:32 ?590次閱讀

吴忠躺衫网络科技有限公司

搜索歷史

微軟正式發(fā)布一個(gè)27億參數(shù)的語言模型—Phi-2

評(píng)論

在算力魔方上本地部署Phi-4模型

AMD發(fā)布10億參數(shù)開源AI模型OLMo

在英特爾酷睿Ultra7處理器上優(yōu)化和部署Phi-3-min模型

中國(guó)石油發(fā)布330億參數(shù)昆侖大模型

谷歌發(fā)布新型大語言模型Gemma 2

微軟發(fā)布PhI-3-Vision模型，提升視覺AI效率

微軟發(fā)布視覺型AI新模型：Phi-3-vision

英特爾優(yōu)化AI產(chǎn)品組合，助力微軟Phi-3家族模型

英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

微軟自研5000億參數(shù)大模型曝光

【大語言模型：原理與工程實(shí)踐】大語言模型的應(yīng)用

【大語言模型：原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

【大語言模型：原理與工程實(shí)踐】揭開大語言模型的面紗

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

微軟發(fā)布phi-3AI模型，性能超越GPT-3.5