在國慶節(jié)前夕,DeepSeek和智譜先后宣布推出新一代大模型。與此同時 ,國產(chǎn)芯片廠商都在第一時間宣布適配,這標志著國產(chǎn)GPU已具備與前沿大模型協(xié)同迭代的能力,加速構(gòu)建自主可控的AI技術(shù)生態(tài) 。
9月29日 ,DeepSeek宣布開源DeepSeek-V3.2-Exp實驗版模型,該模型首次引入了Attention稀疏注意力架構(gòu),并在幾乎不影響模型輸出效果的前提下 ,大幅度提升了長文本訓練和推理效率,被DeepSeek定義為“邁向新一代架構(gòu)的中間步驟”。
華為、寒武紀 、海光已經(jīng)完成適配DeepSeek-V3.2-Exp實驗版模型
在DeepSeek宣布后,算力芯片廠商華為、寒武紀(688256)、海光信息(688041)等AI芯片廠商已經(jīng)宣布適配DeepSeek-V3.2-Exp。
“華為計算”公眾號發(fā)文宣布 ,昇騰已快速基于vLLM/SGLang等推理框架完成適配部署,實現(xiàn)DeepSeek-V3.2-Exp Day 0(第零天)支持,并面向開發(fā)者開源所有推理代碼和算子實現(xiàn) 。DeepSeek-V3.2-Exp在昇騰設備上128K長序列輸出 ,能夠保持TTFT(首token輸出耗時)低于2秒 、TPOT(每token輸出耗時)低于30毫秒的推理生成速度。
在DeepSeek-V3.2-Exp模型宣布開源幾分鐘內(nèi),寒武紀也發(fā)文稱其已同步實現(xiàn)對該模型的Day 0適配,并開源大模型推理引擎vLLM-MLU源代碼。
寒武紀稱,公司一直高度重視大模型軟件生態(tài)建設 ,支持以DeepSeek為代表的所有主流開源大模型 。借助于長期活躍的生態(tài)建設和技術(shù)積累,寒武紀得以快速實現(xiàn)對DeepSeek-V3.2-Exp這一全新實驗性模型架構(gòu)的day 0適配和優(yōu)化。
寒武紀強調(diào),一直重視芯片和算法的聯(lián)合創(chuàng)新 ,致力于以軟硬件協(xié)同的方式,優(yōu)化大模型部署性能,降低部署成本。此前 ,寒武紀對DeepSeek系列模型進行了深入的軟硬件協(xié)同性能優(yōu)化,達成了業(yè)界領(lǐng)先的算力利用率水平 。
針對本次的DeepSeek-V3.2-Exp新模型架構(gòu),寒武紀通過Triton算子開發(fā)實現(xiàn)了快速適配 ,利用BangC融合算子開發(fā)實現(xiàn)了極致性能優(yōu)化,并基于計算與通信的并行策略,再次達成了業(yè)界領(lǐng)先的計算效率水平。依托DeepSeek-V3.2-Exp帶來的全新DeepSeek Sparse Attention機制 ,疊加寒武紀的極致計算效率,可大幅降低長序列場景下的訓推成本,共同為客戶提供極具競爭力的軟硬件解決方案。
海光信息也宣布其DCU實現(xiàn)無縫適配+深度調(diào)優(yōu),做到大模型算力“零等待 ”部署 。
海光信息表示 ,在“深算智能”戰(zhàn)略引領(lǐng)下,海光信息始終致力于AI軟件棧生態(tài)建設,全面支持以DeepSeek為主流的全球主流開源大模型。得益于長期、活躍的技術(shù)積累 ,海光DCU得以快速對DeepSeek-V3.2-Exp完成“Day0”級高效適配與優(yōu)化。
基于GPGPU架構(gòu)強大的生態(tài)優(yōu)勢,與編程開發(fā)軟件棧DIK的特性,DeepSeek-V3.2-Exp在海光DCU上展現(xiàn)出優(yōu)異的性能 ,充分驗證海光DCU高通用性、高生態(tài)兼容度及自主可控的技術(shù)優(yōu)勢,已成為支撐AI大模型訓練與推理的關(guān)鍵基礎設施。
DeepSeek表示,得益于新模型服務成本的大幅降低 ,官方API價格也相應下調(diào),開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上 。從價格來看,輸入緩存命中從0.5元降至0.2元/百萬tokens ,緩存未命中從4元降至2元/百萬tokens,輸出由12元降至3元/百萬tokens。
寒武紀和摩爾線程宣布適配智譜新一代大模型 GLM-4.6
9月30日,智譜正式發(fā)布并開源新一代大模型 GLM-4.6,在 Agentic Coding等核心能力上實現(xiàn)大幅躍升。這是繼 DeepSeek-V3.2-Exp 與 Claude Sonnet 4.5 之后 ,國慶節(jié)前業(yè)界的又一重大技術(shù)發(fā)布 。
智譜表示,在公開基準測試和真實編程任務中,GLM-4.6的代碼生成能力已全面對齊Claude Sonnet 4 ,成為目前國內(nèi)最強的Coding模型。同時,模型在長上下文處理 、推理能力、信息檢索、文本生成及智能體應用等方面均實現(xiàn)全面升級,整體性能超越DeepSeek-V3.2-Exp。作為開源模型 ,GLM-4.6目前是全球開源生態(tài)中性能最強的通用大模型之一,進一步提升了國產(chǎn)大模型在全球競爭格局中的地位 。
智譜官方宣布,GLM-4.6 已在寒武紀領(lǐng)先的國產(chǎn) AI 芯片上實現(xiàn) FP8+Int4 混合量化推理部署 ,這也是首次在國產(chǎn)芯片上投產(chǎn)的 FP8+Int4 模型-芯片一體化解決方案。在保持模型精度不變的前提下,該方案大幅降低了推理成本,為國產(chǎn)芯片本地化運行大模型提供了可行路徑和示范意義。
與此同時 ,摩爾線程基于 vLLM 推理框架完成了對GLM-4.6 的適配,新一代GPU可在原生 FP8 精度下穩(wěn)定運行模型,充分驗證了MUSA 架構(gòu)及全功能GPU在生態(tài)兼容性和快速適配能力方面的優(yōu)勢 。
華為 、寒武紀、摩爾線程等芯片廠商完成對新一代前沿大模型的適配,這標志著國產(chǎn)GPU已具備與前沿大模型協(xié)同迭代的能力 ,加速構(gòu)建自主可控的AI技術(shù)生態(tài)。
智譜表示,未來,國產(chǎn)原創(chuàng)的GLM系列大模型與國產(chǎn)芯片的深度協(xié)同 ,將在模型訓練和推理環(huán)節(jié)持續(xù)推動性能與效率的雙重優(yōu)化,構(gòu)建更加開放、可控 、高效的人工智能基礎設施。
截至30日收盤,寒武紀報收1325元 ,微漲0.11%;海光信息報收252.6元,跌1.27% 。
股票上杠桿什么意思:股票融資方式的優(yōu)缺點-華為不藏了!時隔四年公開再提麒麟芯片!最新三折疊手機發(fā)布 售價17999元起
杠桿股票是什么意思:買股票一般用什么app-“存儲芯片第一股”漸近!長鑫科技完成IPO輔導
炒股加杠桿app下載:線上配資股票-小米首款SoC芯片真容今晚揭曉 對小米意味著什么?
開戶買股票哪些平臺好:杠桿炒股保證金是什么意思-酷暑天債市遇冷 債牛行情要降溫?專家詳細解讀
使用杠桿炒股是什么意思:實盤股票杠桿平臺有哪些-國際金價屢創(chuàng)新高!這類產(chǎn)品價格居高不下
新手怎么做股票:炒股10倍杠桿什么意思-降息大消息!美聯(lián)儲重磅時刻來襲!貝萊德高管成為熱門人選之一
在線炒股配資看必選-線上配資炒股-股票配資公司提示:文章來自網(wǎng)絡,不代表本站觀點。
 
                    【隔夜行情】?周五(2025年3月21日),A股三大指數(shù)集體下跌,截至收盤,截止收盤,滬指跌1.29%,報收33...
記者辛圓3月25日,博鰲亞洲論壇旗艦報告《亞洲經(jīng)濟前景及一體化進程2025年度報告》(以下簡稱《報告》...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
3月24日,易方達國證自由現(xiàn)金流ETF公開發(fā)售。該產(chǎn)品跟蹤國證自由現(xiàn)金流指數(shù),這個指數(shù)是什么?有哪些優(yōu)勢?投資價值如何?...
宏觀要聞市場監(jiān)管總局發(fā)布《公平競爭審查條例實施辦法》市場監(jiān)管總局發(fā)布《公平競爭審查條例實施辦法》,將于4...
記者王珍中國國際經(jīng)濟交流中心副理事長、國務院發(fā)展研究中心原副主任王一鳴周一在“中國發(fā)展高層論壇2025...
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價拉漲,尾盤封漲停板...
近日,開源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認定相關(guān)業(yè)務六個月。該懲處力度在近年來券商分支機構(gòu)中并...