極客網(wǎng)·極客觀察3月28日 近期,DeepSeek-V3-0324正式發(fā)布,迅速在全球AI領(lǐng)域引發(fā)熱議。相較于前作,V3版本雖未實(shí)現(xiàn)顛覆性創(chuàng)新,卻在推理和編程兩大關(guān)鍵領(lǐng)域取得進(jìn)步,為用戶帶來(lái)新的驚喜。
DeepSeek向來(lái)秉持低調(diào)策略,在推出新版本時(shí),既不發(fā)布白皮書進(jìn)行詳細(xì)闡述,也沒(méi)有召開(kāi)盛大發(fā)布會(huì),僅將模型上傳至Hugging Face平臺(tái)。盡管如此,憑借卓越的性能,DeepSeek的每一次更新,都能成功吸引AI社區(qū)的高度關(guān)注。
這一次,V3-0324展現(xiàn)出更強(qiáng)大的復(fù)雜任務(wù)處理能力,在面對(duì)復(fù)雜問(wèn)題時(shí),能對(duì)任務(wù)有更深入理解,并提供更有效的解決方案。對(duì)于Web設(shè)計(jì)師而言,V3能夠生成更為簡(jiǎn)潔高效的代碼,顯著提升Web頁(yè)面和游戲界面的質(zhì)量,極大提高工作效率。
和R1版本一樣,效率依舊是V3-0324的一大突出優(yōu)勢(shì)。當(dāng)前,許多AI模型的運(yùn)行和訓(xùn)練依賴超級(jí)計(jì)算機(jī),這類設(shè)備雖然擁有強(qiáng)大的運(yùn)算能力,能夠處理海量數(shù)據(jù),但使用成本極高。與之相比,V3-0324在維持高性能的同時(shí),有效控制了成本,這使得更多開(kāi)發(fā)者和企業(yè)能夠輕松使用該模型,進(jìn)一步推動(dòng)AI技術(shù)的普及與應(yīng)用。
專家:開(kāi)源模型最終會(huì)成為贏家
有趣的是,該版本在多個(gè)關(guān)鍵領(lǐng)域的進(jìn)步,與谷歌Gemini 2.5 Pro極為相似,不僅在編程能力上大幅提升,推理水平更加出色,在token的使用效率上同樣有了進(jìn)步。
從參數(shù)規(guī)模來(lái)看,DeepSeek之前推出的R1擁有6710億參數(shù),而V3則達(dá)到6850億,參數(shù)數(shù)量略高于前代。這一變化讓業(yè)界普遍認(rèn)為,V3將成為R2版本的重要基礎(chǔ)。AIcpb.com創(chuàng)始人Li Bang zhu指出,V3在編程方面顯著提升,為R2奠定了良好基礎(chǔ)。R2原計(jì)劃于5月初推出,一些專家認(rèn)為,R2可能會(huì)提前和大家見(jiàn)面。
在推理能力上,DeepSeek-V3-0324展現(xiàn)出卓越的實(shí)力。在MMLU-Pro基準(zhǔn)測(cè)試中,其準(zhǔn)確率從75.9%提升至81.2%;在GPQA測(cè)試中,準(zhǔn)確率從59.1%提升至68.4%;在AIME測(cè)試中,準(zhǔn)確率從39.6%大幅躍升至59.4%;在LiveCodeBench測(cè)試中也從39.2%提升至49.2%。
加州大學(xué)博士、奧林匹克數(shù)學(xué)金牌得主Jasper Zhang用AIME 2025難題對(duì)DeepSeek-V3-0324進(jìn)行嚴(yán)格測(cè)試,結(jié)果顯示,V3各項(xiàng)表現(xiàn)出色。基于此,Jasper Zhang對(duì)開(kāi)源模型充滿信心,堅(jiān)信其在未來(lái)的AI競(jìng)賽中能夠獲勝。目前,他創(chuàng)建的Hyperbolic公司已全面支持V3模型。
眾多外媒在性能測(cè)試后普遍得出結(jié)論:V3-0324相較R1版本,性能有了飛躍。蘋果設(shè)備研究人員Awni Hannun確認(rèn),在搭載M3 Ultra芯片的Mac設(shè)備上,V3的運(yùn)行效率可達(dá)每秒20 tokens,他認(rèn)為,以前人們都認(rèn)為AI模型需要企業(yè)級(jí)基礎(chǔ)設(shè)施,現(xiàn)在證明并非如此。這一數(shù)據(jù)不僅彰顯了V3-0324的高效,更表明DeepSeek在面對(duì)OpenAI等行業(yè)巨頭時(shí)沒(méi)有落后,還證明了AI模型運(yùn)行對(duì)企業(yè)級(jí)基礎(chǔ)設(shè)施的依賴并非不可撼動(dòng)。
一直以來(lái),AI模型的運(yùn)行高度依賴英偉達(dá)GPU,高昂的價(jià)格讓許多開(kāi)發(fā)者望而卻步。與之形成鮮明對(duì)比的是,Mac Studio在進(jìn)行推理時(shí)功耗不到200瓦,極大降低了使用成本。
開(kāi)發(fā)者兼AI專家Simon Willison敏銳地指出,V3-0324支持本地部署,這一特性或?qū)⑼苿?dòng)AI產(chǎn)業(yè)發(fā)生深刻變革。以往,AI模型多部署于中心化數(shù)據(jù)中心,而未來(lái),部署方式將朝著去中心化、高效化方向發(fā)展,消費(fèi)級(jí)設(shè)備在AI應(yīng)用中將發(fā)揮更大作用。
普通開(kāi)發(fā)者:很強(qiáng),但編程還要優(yōu)化
一位名叫Hamed的國(guó)外開(kāi)發(fā)者發(fā)表評(píng)論稱,讓Gemini 2.5 pro和DeepSeek-V3-0324編寫代碼,制作國(guó)際象棋小程序,前者生成570行代碼,后者生成2372行。
開(kāi)發(fā)者vewin說(shuō):“V3-0324相當(dāng)強(qiáng)大,它用R1約十分之一的token成本獲得了相似的性能。”
Julian Goldie SEO則表示,在內(nèi)容生成方面,V3-0324超越了谷歌Gemini 2.5。評(píng)測(cè)之后他得出幾個(gè)結(jié)論:DeepSeek撰寫的內(nèi)容更有說(shuō)服力,Gemini的推理能力十分出色,二者都能免費(fèi)使用,但它們的API功能都有一些Bug。
開(kāi)發(fā)者Hassan認(rèn)為:“根據(jù)我的測(cè)試,V3更聰明了,這種聰明是全方位的,編程相當(dāng)優(yōu)秀,執(zhí)行前端任務(wù)更是如此?!?/p>
開(kāi)發(fā)者bilLkarkariy要求V3-0324和Gemini Pro 2.5為應(yīng)用程序設(shè)計(jì)一個(gè)登錄頁(yè)面,對(duì)比之后他感到震驚,DeepSeek給出了完整、立刻就能用的解決方案。
當(dāng)然,有人肯定也有人否定。
一位名叫Bindu Reddy的女性開(kāi)發(fā)者提出反對(duì)意見(jiàn),她認(rèn)為:“V3非???,是一個(gè)巨大的進(jìn)步,但在真實(shí)編程中,V3仍然離Sonnet3.7有不小差距。”專門評(píng)測(cè)大模型的Markus Zimmermann認(rèn)為:“用DevQualityEval 1.0測(cè)試,發(fā)現(xiàn)V3-0324的表現(xiàn)不如之前的DeepSeek V3?!?/p>
總體而言,開(kāi)發(fā)者對(duì)V3-0324相當(dāng)肯定,負(fù)面聲音比較小。
開(kāi)發(fā)者Petri Kuittinen讓V3給AI企業(yè)制作漂亮的響應(yīng)式前端網(wǎng)頁(yè),只需要一條提示語(yǔ),就能將各種元素融合進(jìn)去。他認(rèn)為,DeepSeek V3-0324是DeepSeek最好的非推理模型,通常更適合創(chuàng)意性寫作任務(wù),比R1更適合制作HTML5+CSS+前端。在上面的任務(wù)中,它生成958行代碼,里面包括圖片、交互式網(wǎng)站。
Petri Kuittinen認(rèn)為:“Anthropic和OpenAI已經(jīng)陷入麻煩。V3-0324真的可以編程,可以制作漂亮的HTML5、CSS,前端部署相當(dāng)容易,而且免費(fèi)使用?!保ㄐ〉叮?/p>
- 鯤鵬向“智”,“轅”啟未來(lái)
- 人形機(jī)器人格斗首秀背后:一場(chǎng)生態(tài)體系的中美較量
- 開(kāi)放創(chuàng)新托舉產(chǎn)業(yè)生態(tài),昇騰AI持續(xù)升騰
- 硅基模型vs.碳基大腦:AI能否成為超越人類的超級(jí)預(yù)測(cè)者?
- 1ms城市算網(wǎng)中國(guó)行正式啟動(dòng),城市數(shù)字化發(fā)展迎新方向
- “創(chuàng)新取實(shí)”vs.“投機(jī)主義”:5G與ORAN六年發(fā)展結(jié)果迥異
- AI遭遇生產(chǎn)力和營(yíng)收困境,“索洛悖論”正在重演?
- 特朗普極力向沙特推銷AI 項(xiàng)目能否落地要打個(gè)問(wèn)號(hào)
- 華為鴻蒙電腦來(lái)了!真正挑戰(zhàn)Wintel的先鋒力量
- 模型越新幻覺(jué)越重!AI幻覺(jué)扣住產(chǎn)業(yè)發(fā)展命脈
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。