中國(guó)大模型,首登Nature封面。
9月17日,在最新一期的國(guó)際權(quán)威期刊Nature(自然)中 ,DeepSeek-R1推理模型研究論文登上了封面 。該論文由DeepSeek團(tuán)隊(duì)共同完成,梁文鋒擔(dān)任通訊作者,首次公開(kāi)了僅靠強(qiáng)化學(xué)習(xí)就能激發(fā)大模型推理能力的重要研究成果。這是中國(guó)大模型研究首次登上Nature封面 ,也是全球首個(gè)經(jīng)過(guò)完整同行評(píng)審并發(fā)表于權(quán)威期刊的主流大語(yǔ)言模型研究,標(biāo)志著中國(guó)AI技術(shù)在國(guó)際科學(xué)界獲得最高認(rèn)可。
Nature在其社論中評(píng)價(jià)道:“幾乎所有主流的大模型都還沒(méi)有經(jīng)過(guò)獨(dú)立同行評(píng)審,這一空白終于被DeepSeek打破 。”
中國(guó)AI大模型的“Nature時(shí)刻 ”
自大模型浪潮席卷全球以來(lái) ,技術(shù)發(fā)布、性能榜單層出不窮,但始終缺乏一個(gè)權(quán)威的“科學(xué)認(rèn)證”機(jī)制。OpenAI 、谷歌等巨頭雖屢有突破,但其核心技術(shù)多以技術(shù)報(bào)告形式發(fā)布 ,未經(jīng)獨(dú)立同行評(píng)審。
DeepSeek以其公開(kāi)性和透明性打破了這一局面 。DeepSeek-R1模型的研究論文最早于今年年初發(fā)布在預(yù)印本平臺(tái)arXiv上。自今年2月14日向Nature投遞論文至今,歷經(jīng)半年,8位外部專家參與了同行評(píng)審 ,DeepSeek-R1推理模型研究論文終獲發(fā)表,完成了從預(yù)印本到Nature封面的“學(xué)術(shù)躍遷”。審稿人不僅關(guān)注模型性能,更對(duì)數(shù)據(jù)來(lái)源、訓(xùn)練方法、安全性等提出嚴(yán)格質(zhì)詢,這一過(guò)程是AI模型邁向更高的透明度和可重復(fù)性的可喜一步 。
因此 ,Nature也對(duì)DeepSeek的開(kāi)放模式給予高度評(píng)價(jià),在其社論中評(píng)價(jià)道:“幾乎所有主流的大模型都還沒(méi)有經(jīng)過(guò)獨(dú)立同行評(píng)審,這一空白終于被DeepSeek打破。 ”全球知名開(kāi)源社區(qū)Hugging Face機(jī)器學(xué)習(xí)工程師Lewis Tunstall也是DeepSeek論文的審稿人之一 ,他強(qiáng)調(diào):“這是一個(gè)備受歡迎的先例。如果缺乏這種公開(kāi)分享大部分研發(fā)過(guò)程的行業(yè)規(guī)范,我們將很難評(píng)估這些系統(tǒng)的潛在風(fēng)險(xiǎn) 。”
據(jù)了解,DeepSeek本次在Nature上發(fā)表的論文較今年年初的初版論文有較大的改動(dòng) ,全文64頁(yè),不僅首次披露了R1的訓(xùn)練成本,而且透露了更多模型訓(xùn)練的技術(shù)細(xì)節(jié) ,包括對(duì)發(fā)布初期外界有關(guān)“蒸餾”方法的質(zhì)疑作出了正面回應(yīng),提供了訓(xùn)練過(guò)程中減輕數(shù)據(jù)污染的詳細(xì)流程,并對(duì)R1的安全性進(jìn)行了全面評(píng)估。
其中 ,在訓(xùn)練成本方面,R1-Zero和R1都使用了512張H800GPU,分別訓(xùn)練了198個(gè)小時(shí)和80個(gè)小時(shí),以H800每GPU小時(shí)2美元的租賃價(jià)格換算 ,R1的總訓(xùn)練成本為29.4萬(wàn)美元(約合人民幣209萬(wàn)元)。不到30萬(wàn)美元的訓(xùn)練成本,與其他推理模型動(dòng)輒上千萬(wàn)美元的花費(fèi)相比,可謂實(shí)現(xiàn)了極大的降本。
關(guān)于R1發(fā)布最初時(shí)所受到的“蒸餾 ”質(zhì)疑 ,DeepSeek介紹,其使用的數(shù)據(jù)全部來(lái)自互聯(lián)網(wǎng),雖然可能包含GPT-4生成的結(jié)果 ,但并非有意而為之,更沒(méi)有專門(mén)的蒸餾環(huán)節(jié) 。所謂“蒸餾”,簡(jiǎn)單理解就是用預(yù)先訓(xùn)練好的復(fù)雜模型輸出的結(jié)果 ,作為監(jiān)督信號(hào)再去訓(xùn)練另外一個(gè)模型。R1發(fā)布時(shí),OpenAI稱它發(fā)現(xiàn)DeepSeek使用了OpenAI專有模型來(lái)訓(xùn)練自己的開(kāi)源模型的證據(jù),但拒絕進(jìn)一步透露其證據(jù)的細(xì)節(jié)。
R2何時(shí)問(wèn)世引發(fā)關(guān)注
自今年年初發(fā)布R1以來(lái) ,DeepSeek在全球樹(shù)立了開(kāi)源模型的典范,但過(guò)去數(shù)月,外界對(duì)于R2何時(shí)發(fā)布始終保持高度關(guān)注,相關(guān)傳言一直不斷 。不過(guò) ,R2的發(fā)布時(shí)間一再推遲,外界分析R2研發(fā)進(jìn)程緩慢可能與算力受限有關(guān)。
值得注意的是,今年8月21日 ,DeepSeek正式發(fā)布DeepSeek-V3.1,稱其為“邁向Agent(智能體)時(shí)代的第一步”。據(jù)DeepSeek介紹,V3.1主要包含三大變化:一是采用混合推理架構(gòu) ,一個(gè)模型同時(shí)支持思考模式與非思考模式;二是具有更高的思考效率,能在更短時(shí)間內(nèi)給出答案;三是具有更強(qiáng)的智能體能力,通過(guò)后訓(xùn)練優(yōu)化 ,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升 。
由于R1的基座模型為V3,V3.1的升級(jí)也引發(fā)了外界對(duì)于R2“在路上 ”的猜測(cè)。V3.1的升級(jí)更深刻的意義在于,DeepSeek強(qiáng)調(diào)DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度 ,而UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。這也表明未來(lái)基于DeepSeek模型的訓(xùn)練與推理有望更多應(yīng)用國(guó)產(chǎn)AI芯片,助力國(guó)產(chǎn)算力生態(tài)加速建設(shè) 。這一表態(tài)一度帶動(dòng)國(guó)產(chǎn)芯片算力股股價(jià)飆升。
中國(guó)銀河證券研報(bào)指出,DeepSeek從V3版本就開(kāi)始采用FP8參數(shù)精度驗(yàn)證了其訓(xùn)練的有效性,通過(guò)降低算力精度 ,使國(guó)產(chǎn)ASIC芯片能在成熟制程(12-28nm)上接近先進(jìn)制程英偉達(dá)GPU的算力精度,DeepSeek-V3.1使用UE8M0 FP8 Scale參數(shù)精度,讓軟件去主動(dòng)擁抱硬件更喜歡的數(shù)據(jù)格式 ,“軟硬協(xié)同”的生態(tài)技術(shù)壁壘逐漸成為AI浪潮下新范式,未來(lái)國(guó)產(chǎn)大模型將更多擁抱FP8算力精度并有望成為一種新技術(shù)趨勢(shì),通過(guò)軟硬件的協(xié)同換取數(shù)量級(jí)性能的提升 ,國(guó)產(chǎn)算力芯片將迎來(lái)變革。
買(mǎi)股票杠桿怎么操作:在線炒股配資選擇配資-9月12日龍虎榜復(fù)盤(pán):“章盟主”4.82億元凈買(mǎi)入芯原股份
手機(jī)上如何買(mǎi)股票:炒股杠桿怎么開(kāi)戶-中國(guó)造不出AI芯片?黃仁勛:僅落后美國(guó)“幾納秒”
股票長(zhǎng)線操作技巧:炒股平臺(tái)杠桿-中美下一輪關(guān)稅談判或討論中國(guó)購(gòu)買(mǎi)俄伊石油問(wèn)題?外交部回應(yīng)
買(mǎi)入賣(mài)出有什么技巧股票:炒股配資網(wǎng)-股價(jià)暴漲!近60億美元大訂單 中國(guó)AI制藥創(chuàng)下新紀(jì)錄!A股高成長(zhǎng)概念股稀缺
股票配債了,怎么操作:炒股配資開(kāi)-美國(guó)國(guó)債遭遇拋售之際 比特幣又悄悄創(chuàng)出歷史新高
炒股里的加杠桿是什么意思:手機(jī)買(mǎi)賣(mài)股票怎么操作-百度突然猛拉!兩大業(yè)務(wù)亮了 外資集體增持
在配資炒股:怎么在手機(jī)玩股票-鴻海Q3營(yíng)收創(chuàng)同期新高 AI服務(wù)器需求強(qiáng)勁 Q4料持續(xù)放量
在線炒股配資看必選-線上配資炒股-股票配資公司提示:文章來(lái)自網(wǎng)絡(luò),不代表本站觀點(diǎn)。
 
                    【隔夜行情】?周五(2025年3月21日),A股三大指數(shù)集體下跌,截至收盤(pán),截止收盤(pán),滬指跌1.29%,報(bào)收33...
記者辛圓3月25日,博鰲亞洲論壇旗艦報(bào)告《亞洲經(jīng)濟(jì)前景及一體化進(jìn)程2025年度報(bào)告》(以下簡(jiǎn)稱《報(bào)告》...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡(jiǎn)稱“寧波倍松”)擬通過(guò)大宗交易...
3月24日,易方達(dá)國(guó)證自由現(xiàn)金流ETF公開(kāi)發(fā)售。該產(chǎn)品跟蹤國(guó)證自由現(xiàn)金流指數(shù),這個(gè)指數(shù)是什么?有哪些優(yōu)勢(shì)?投資價(jià)值如何?...
宏觀要聞市場(chǎng)監(jiān)管總局發(fā)布《公平競(jìng)爭(zhēng)審查條例實(shí)施辦法》市場(chǎng)監(jiān)管總局發(fā)布《公平競(jìng)爭(zhēng)審查條例實(shí)施辦法》,將于4...
記者王珍中國(guó)國(guó)際經(jīng)濟(jì)交流中心副理事長(zhǎng)、國(guó)務(wù)院發(fā)展研究中心原副主任王一鳴周一在“中國(guó)發(fā)展高層論壇2025...
3月24日,海洋王照明科技股份有限公司(以下簡(jiǎn)稱“海洋王”,002724.SZ)早盤(pán)一字跌停,此后股價(jià)拉漲,尾盤(pán)封漲停板...
近日,開(kāi)源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認(rèn)定相關(guān)業(yè)務(wù)六個(gè)月。該懲處力度在近年來(lái)券商分支機(jī)構(gòu)中并...