文 | 智能相對論
作者 | 陳泊丞
今年年初,DeepSeek-R1以低成本、高性能以及開源特性在全球AI圈內(nèi)爆火走紅,風頭一度壓過OpenAI,同時也開啟了國產(chǎn)推理模型持續(xù)“狂飆”時刻。
回顧過去的2025上半年,「智能相對論」統(tǒng)計發(fā)現(xiàn),在DeepSeek之外,阿里、科大訊飛、小米、月之暗面、商湯科技等廠商都陸續(xù)宣告自家大模型對OpenAI系列模型產(chǎn)品的追趕或是超越。
智能相對論制圖
國產(chǎn)模型的加速“狂飆”有目共睹。OpenAI在今年4月一改口風,發(fā)布了o3/o4 mini模型,或許也有來自后來者追趕的壓力。但是,對于國產(chǎn)模型而言,比起性能上的追趕和超越,自我的發(fā)展節(jié)奏也在上半年逐漸形成,初見端倪。
國產(chǎn)模型的“彎道超車”
DeepSeek的走紅并非是其性能完全超越OpenAI,而是來自于低成本優(yōu)勢和開源生態(tài)帶來的顛覆性體驗,使其迅速“破圈”,成為全球熱門AI模型。在過去的半年內(nèi),延續(xù)DeepSeek的破圈邏輯,國產(chǎn)模型似乎也瞄準了類似的路徑。
一、低成本突圍,用更少的算力追趕OpenAI的性能。
前不久,阿里千問3登頂全球最強開源模型,也在一定程度上完成了國產(chǎn)模型的破圈。成就這次現(xiàn)象的關鍵除了模型快速上線通義App之外,還有就是自身的高性能與低成本特性,其性能在超越OpenAI-o1與DeepSeek-R1的同時,部署成本大幅降低,僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。
盡管在性能上,國產(chǎn)模型很難跟OpenAI拉開太大的差距,但是在部署成本上的持續(xù)優(yōu)化,從另一個角度真正意義上完成了對OpenAI的追趕。幾乎是同一時間,星火X1也完成升級,整體效果對標OpenAI-o1與DeepSeek-R1。而在算力成本上,星火X1不僅是業(yè)界唯一基于全國產(chǎn)算力訓練的深度推理模型,還成功實現(xiàn)了只需4張華為910B芯片即可完成部署,把國產(chǎn)模型的低成本特性再度“打爆”。
中美博弈態(tài)勢加劇,美國對華的算力管控越來越嚴格,從某種程度來說,這是一種無奈之舉,但同時也是一個強勢突圍的方向,依托低成本部署優(yōu)勢,國產(chǎn)模型在AI普惠與行業(yè)應用中具備更強的適配性。若能繼續(xù)沿著這一方向突圍,國產(chǎn)模型的行業(yè)滲透率將在今年下半年繼續(xù)保持強勢增長。
二、開源生態(tài)破局,重新制定行業(yè)規(guī)則,打破技術霸權秩序。
DeepSeek-R1采用MIT協(xié)議,千問3采用Apache2.0協(xié)議,均是極寬松的開源協(xié)議,在OpenAI的閉源霸權之下,國產(chǎn)模型更熱衷于用開源策略來吸引全球開發(fā)者的目光,打造一個更廣泛的模型生態(tài),從而制衡OpenAI的先發(fā)優(yōu)勢與性能主義。這一策略正在被更多的國產(chǎn)模型所復刻,小米也開源了MiMo。
如今,中國的模型廠商在開源路徑上不斷走出自己的特色,不僅開放了不同參數(shù)規(guī)格的模型產(chǎn)品,還包括各種量化版本、完整的訓練數(shù)據(jù)集以及微調(diào)所需的數(shù)據(jù)模板等,滿足了不同場景下的實際需求,甚至是給到詳細的API設計和文檔,方便開發(fā)者快速集成和使用。
在開源上,國產(chǎn)模型表現(xiàn)出積極的態(tài)度。比起性能上的追趕,國產(chǎn)模型也正在試圖在開源與性能之間中找到一個平衡點,基于完善的服務和生態(tài)來實現(xiàn)模型的超越。值得一提的,DeepSeek-R1、千問3在HuggingFace等開源社區(qū)上均取得了開發(fā)者們不錯的反饋,整個千問系列的全球衍生模型更是超過10萬個,超越美國Llama位列第一,說明國產(chǎn)模型的開源策略正在被更多的全球開發(fā)者所認可。
三、特定能力強化,專為行業(yè)應用而打造,實用主義的國產(chǎn)屬性爆表。
現(xiàn)階段,國產(chǎn)模型對OpenAI的超越更多體現(xiàn)在特定的能力或任務處理上。日日新V6的多模態(tài)處理能力對標OpenAI-o1,同時迭代成為國內(nèi)首個支持10分鐘中長視頻深度解析的大模型。
為什么要這么強化特定能力?商湯科技認為,比起文本性的內(nèi)容消費,視頻、圖文結合是更大的內(nèi)容消費市場。由此,日日新V6把語音、視頻、文字形成一個統(tǒng)一跟時間軸對齊的上下文表達,從而實現(xiàn)人機交互更自然、高效。這種做法更多是從實際的行業(yè)應用出發(fā),日日新V6的能力強化正是為了具身智能的突破做準備。
這樣的做法類似于中國的古代智慧“田忌賽馬”,OpenAI-o1在結構化推理方面優(yōu)勢顯著,而國產(chǎn)模型則在中文語境、多模態(tài)能力、成本效率上進行非對稱競爭,不去和OpenAI強勢的一面做對抗。同時,這也符合當前本土產(chǎn)業(yè)在AI應用過程中對模型能力的需求,順勢讓國產(chǎn)模型更快地進入企業(yè)級市場,加速商業(yè)化。
模型“狂飆”:OpenAI向左,國產(chǎn)向右
在今年上半年,OpenAI已經(jīng)推出更強、更智能的o3和o4-mini模型。盡管在成本效率上無法達到國產(chǎn)模型的夸張水平,但OpenAI在上代相同的延遲和成本上實現(xiàn)了更強的性能體驗。
OpenAI對模型性能的追求依舊是業(yè)內(nèi)標桿,作為最新的旗艦模型,o3和o4-mini(無工具版本)在AIME 2024數(shù)學競賽題目中的準確率分別達91.6%和93.4%,遠遠甩開o1的74.3%的成績。而在Codeforces編程競賽評分中,支持終端工具的o3和o4-mini也分別取得2706和2719的ELO分數(shù),領先程度有目共睹,展現(xiàn)了其在數(shù)學和代碼能力上的巨大突破。
除此之外,OpenAI的新模型在知識問答、多模態(tài)推理等方面也都表現(xiàn)出更強大的能力,再次奠定了其在AI行業(yè)的領軍地位。相對而言,國產(chǎn)模型的路徑更多傾向于行業(yè)應用,綜合特定能力、成本效率、應用流程等條件下追求更適配的AI解決方案。
日前,階躍星辰發(fā)布并開源3D模型Step1X-3D,同一時間還公布了完整的數(shù)據(jù)清洗策略,數(shù)據(jù)預處理策略,以及800K高質(zhì)量的3D資產(chǎn),3D VAE、3D geometry Diffusion以及 texture Diffusion的全鏈路訓練代碼開源?;谶@些強而有力的措施,國產(chǎn)模型在造福開發(fā)者的同時,也在用近乎掀桌子的方式引領一個全新的3D社群生態(tài)。
垂直領域的能力強化、開源策略吸引開發(fā)者以及各種成本效率優(yōu)勢......綜合以上種種優(yōu)勢,國產(chǎn)模型在上半年正在形成類似的打法來尋求市場突圍。當然,盡管如此,國產(chǎn)模型也沒有放棄主流的前進方向,比如多模態(tài)能力依舊是OpenAI和國產(chǎn)模型的主要迭代方向,基礎模型的能力研發(fā)與突破同樣也在國產(chǎn)廠商的考量之內(nèi)。
寫在最后
即將過去的2025上半年,是國產(chǎn)模型的高光時刻,也是一眾國產(chǎn)模型在面對OpenAI的強勢攻勢與全球市場激烈博弈下持續(xù)尋求突圍的關鍵階段。在這場AI比拼中,盡管國產(chǎn)模型依舊熱衷于對標OpenAI,但是走的路卻是逐步形成了自己的特色。
從某種程度來說,國產(chǎn)模型不再是完全的追隨者,也在進化為獨立的引領者。在諸多國產(chǎn)模型的發(fā)展上,這一趨勢或許在下半年會越來越明顯。
*本文圖片均來源于網(wǎng)絡
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。