今天,我們正式發(fā)布 DeepSeek-R1,并同步開源模型權(quán)重。
DeepSeek-R1 遵循 MIT License,允許用戶通過蒸餾技術(shù)借助 R1 訓(xùn)練其他模型。
DeepSeek-R1 上線API,對用戶開放思維鏈輸出,通過設(shè)置 `model='deepseek-reasoner'` 即可調(diào)用。
DeepSeek 官網(wǎng)與 App 即日起同步更新上線。
性能對齊OpenAI-o1正式版 DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。
在此,我們將 DeepSeek-R1 訓(xùn)練技術(shù)全部公開,以期促進技術(shù)社區(qū)的充分交流與創(chuàng)新協(xié)作。
論文鏈接:
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
蒸餾小模型超越 OpenAI o1-mini
我們在開源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個 660B 模型的同時,通過 DeepSeek-R1 的輸出,蒸餾了 6 個小模型開源給社區(qū),其中 32B 和 70B 模型在多項能力上實現(xiàn)了對標(biāo) OpenAI o1-mini 的效果。
HuggingFace鏈接:
https://huggingface.co/deepseek-ai
開放的許可證和用戶協(xié)議
為了推動和鼓勵開源社區(qū)以及行業(yè)生態(tài)的發(fā)展,在發(fā)布并開源 R1 的同時,我們同步在協(xié)議授權(quán)層面也進行了如下調(diào)整:
模型開源 License 統(tǒng)一使用 MIT。我們曾針對大模型開源的特點,參考當(dāng)前行業(yè)的通行實踐,特別引入 DeepSeek License 為開源社區(qū)提供授權(quán),但實踐表明非標(biāo)準(zhǔn)的開源 License 可能反而增加了開發(fā)者的理解成本。為此,此次我們的開源倉庫(包括模型權(quán)重)統(tǒng)一采用標(biāo)準(zhǔn)化、寬松的 MIT License,完全開源,不限制商用,無需申請。
產(chǎn)品協(xié)議明確可“模型蒸餾”。為了進一步促進技術(shù)的開源和共享,我們決定支持用戶進行“模型蒸餾”。我們已更新線上產(chǎn)品的用戶協(xié)議,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。
App與網(wǎng)頁端
登錄DeepSeek官網(wǎng)或官方App,打開“深度思考”模式,即可調(diào)用最新版 DeepSeek-R1 完成各類推理任務(wù)。
API 及定價
DeepSeek-R1 API 服務(wù)定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元。
詳細的 API 調(diào)用指南請參考官方文檔:
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
-
開源
+關(guān)注
關(guān)注
3文章
3402瀏覽量
42711 -
OpenAI
+關(guān)注
關(guān)注
9文章
1132瀏覽量
6694
原文標(biāo)題:DeepSeek-R1發(fā)布,性能對標(biāo)OpenAI o1正式版
文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
OpenAI發(fā)布o1大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍海?
![<b class='flag-5'>OpenAI</b><b class='flag-5'>發(fā)布</b><b class='flag-5'>o1</b>大模型,數(shù)理化水平比肩人類博士,國產(chǎn)云端推理芯片的新藍海?](https://file1.elecfans.com/web2/M00/06/57/wKgZombkDl6AAndRAANcnqU1SLc245.png)
百度云與阿里云上線DeepSeek模型部署服務(wù)
DeepSeek登頂蘋果中美兩區(qū)App免費榜
英偉達發(fā)布DeepSeek R1于NIM平臺
美格智能AIMO智能體+DeepSeek-R1模型,AI應(yīng)用的iPhone時刻來了
![美格智能AIMO智能體+<b class='flag-5'>DeepSeek-R1</b>模型,AI應(yīng)用的iPhone時刻來了](https://file1.elecfans.com//web3/M00/07/1F/wKgZPGeV-OGAAQuhAACNIKvlB7M621.png)
趕緊在本地運行與OpenAI-o1能力近似的DeepSeek-R1模型
![趕緊在本地運行與<b class='flag-5'>OpenAI-o1</b>能力近似的<b class='flag-5'>DeepSeek-R1</b>模型](https://file1.elecfans.com/web3/M00/06/BF/wKgZPGePOzOAE5GkAAeMma6stxc194.png)
評論