DeepSeek公司近日震撼發(fā)布其最新一代大語(yǔ)言模型——DeepSeek-V3.1,此舉標(biāo)志著全球AI市場(chǎng)競(jìng)爭(zhēng)的進(jìn)一步白熱化。此次更新通過引入創(chuàng)新的混合推理架構(gòu)和顯著增強(qiáng)的智能體能力,為AI領(lǐng)域帶來(lái)了革命性的變化。
DeepSeek-V3.1的核心亮點(diǎn)在于其革命性的混合推理架構(gòu),這一架構(gòu)使模型能夠在同一框架下靈活切換“思考”與“非思考”兩種模式。據(jù)官方公告,新版本經(jīng)過深度訓(xùn)練和優(yōu)化,在工具使用、編程、搜索等智能體任務(wù)上的表現(xiàn)實(shí)現(xiàn)了質(zhì)的飛躍。尤為V3.1采用了針對(duì)下一代國(guó)產(chǎn)芯片設(shè)計(jì)的UE8M0 FP8 Scale參數(shù)精度。
社區(qū)測(cè)試數(shù)據(jù)揭示了新模型的卓越性能。在Aider多語(yǔ)言編程基準(zhǔn)測(cè)試中,DeepSeek-V3.1的得分超越了Anthropic的Claude 4 Opus,并且在成本控制上展現(xiàn)出顯著優(yōu)勢(shì)。這一成績(jī)迅速在開發(fā)者社區(qū)中引發(fā)了熱烈反響,模型在Hugging Face平臺(tái)上的關(guān)注度飆升。
為了提升用戶體驗(yàn),DeepSeek同步升級(jí)了API接口,不僅將上下文窗口擴(kuò)展至128K,還新增了對(duì)Anthropic API格式的支持,極大簡(jiǎn)化了遷移過程。更為關(guān)鍵的是,公司宣布將于2025年9月6日起實(shí)施新的API定價(jià)方案,并取消夜間優(yōu)惠,這一舉措被視為其在服務(wù)能力大幅提升后加速商業(yè)化進(jìn)程的重要一步。
混合推理架構(gòu)的引入,標(biāo)志著DeepSeek正邁向智能體時(shí)代的新篇章。據(jù)DeepSeek官網(wǎng)介紹,此次升級(jí)帶來(lái)了多項(xiàng)重大變化:混合推理架構(gòu)讓模型同時(shí)支持思考模式與非思考模式,思考效率顯著提升,相比前代模型,DeepSeek-V3.1-Think能在更短時(shí)間內(nèi)給出答案。通過Post-Training優(yōu)化,新模型在工具使用和智能體任務(wù)中的表現(xiàn)得到了大幅提升。
在效率方面,新的思考模式經(jīng)過思維鏈壓縮訓(xùn)練,相比上一代模型,在任務(wù)表現(xiàn)相當(dāng)?shù)那闆r下,token消耗量減少了20%至50%。這一改進(jìn)不僅提升了模型的性能,還降低了運(yùn)行成本,增強(qiáng)了其在商業(yè)場(chǎng)景中的競(jìng)爭(zhēng)力。
新模型在編程和搜索等智能體能力方面實(shí)現(xiàn)了顯著增強(qiáng)。DeepSeek公布的數(shù)據(jù)顯示,V3.1在代碼修復(fù)和命令行終端任務(wù)測(cè)試中,性能相較于公司以往模型有了明顯提高。在復(fù)雜搜索測(cè)試中,模型同樣表現(xiàn)出色,大幅領(lǐng)先于競(jìng)爭(zhēng)對(duì)手。社區(qū)進(jìn)行的第三方測(cè)試進(jìn)一步證實(shí)了V3.1在編程能力上的躍升,其在Aider編程基準(zhǔn)上取得了71.6%的高分,超越了多個(gè)知名模型,且成本效益顯著。
在開源與API更新方面,DeepSeek繼續(xù)其開放策略,將V3.1的Base模型和后訓(xùn)練模型發(fā)布在Hugging Face與魔搭社區(qū)上。此次發(fā)布的模型參數(shù)量為685B,Base模型在V3基礎(chǔ)上進(jìn)行了額外的840B token訓(xùn)練。公司提醒開發(fā)者注意,新模型采用了新的參數(shù)精度,且分詞器和聊天模板有所調(diào)整,部署時(shí)需參考最新文檔。
API服務(wù)也迎來(lái)了全面升級(jí)。除了擴(kuò)展上下文長(zhǎng)度外,DeepSeek還為開發(fā)者提供了更強(qiáng)大的工具調(diào)用功能,如支持strict模式的Function Calling,以確保輸出格式的規(guī)范性。為降低生態(tài)遷移成本,API增加了對(duì)Anthropic API格式的兼容支持,方便使用Claude Code框架的開發(fā)者接入DeepSeek模型。
在技術(shù)與產(chǎn)品更新的同時(shí),DeepSeek也邁出了堅(jiān)定的商業(yè)化步伐。公司宣布將于2025年9月6日起調(diào)整API接口調(diào)用價(jià)格,并取消夜間時(shí)段優(yōu)惠。這一調(diào)整旨在更好地滿足用戶調(diào)用需求,并伴隨著API服務(wù)資源的擴(kuò)容。