過去幾天,中美經(jīng)貿(mào)關(guān)系發(fā)生著極速變化。而變化的主基調(diào)是,美國希望從貿(mào)易戰(zhàn)的短期沖撞,重新回到長期進行,同時也更加殘酷的科技絞殺上。
5月12日中美雙方發(fā)布聯(lián)合聲明,決定大幅下降關(guān)稅。緊隨其后的5月14日,美國政府亮出了瞄準(zhǔn)中國AI的“獠牙”,美國商務(wù)部工業(yè)與安全局(BIS)突然宣布,即日起在全球范圍內(nèi)禁用中國先進集成電路。
美國出招絕非無的放矢,就在一個月前,華為發(fā)布了CloudMatrix384 超節(jié)點,該技術(shù)通過384張卡構(gòu)建超節(jié)點集群,超級云服務(wù)器,最高提供300Pflops的算力規(guī)模。這意味著,美國通過N卡禁售來限制中國AI算力發(fā)展的技術(shù)圍堵,或?qū)⒈粡氐状蚱啤?/p>
從DeepSeek的算法層突破,到CloudMatrix384的算力層突圍,中國AI正以系統(tǒng)性創(chuàng)新,彌補單芯片制程差距,美國發(fā)現(xiàn)其“卡脖子”邏輯正在失效。
接下來,美國必然會進一步打壓中國AI的任何生存空間,更證明了模型自主與算力自強的重要性。昇騰云算力就是出路,就是防線。
5月16日,華為云AI峰會中,華為云副總裁黃瑾又進一步披露了更多CloudMatrix 384 超節(jié)點的創(chuàng)新技術(shù)細節(jié)。CloudMatrix 384 超節(jié)點持續(xù)壯大,把“殺不死你的必會讓你更強大”寫進現(xiàn)實。
過去的8年里,單卡硬件的算力增長了40倍,但是節(jié)點內(nèi)的總線帶寬只增長了9倍,跨節(jié)點的網(wǎng)絡(luò)帶寬只增長了4倍。集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn),也是科技競逐的焦點之一。
514美國禁令的恐懼根源,或許就在于昇騰的架構(gòu)創(chuàng)新,破解了網(wǎng)絡(luò)帶寬拓展比單卡算力增長更滯后的技術(shù)難題,使CloudMatrix384 實現(xiàn)了集群穩(wěn)定性,中國AI的算力長城,正在CloudMatrix384的基石上崛起。
具體來說,CloudMatrix 384 超節(jié)點實現(xiàn)了MatrixLink超節(jié)點網(wǎng)絡(luò)服務(wù)。這項技術(shù)能夠通過擴展訓(xùn)練集群實現(xiàn)大模型的訓(xùn)推性能提升20%,從而在網(wǎng)絡(luò)側(cè)滿足最為苛刻的模型推訓(xùn)需求。
突破了內(nèi)外部通信瓶頸的CloudMatrix 384,實現(xiàn)了AI算力資源的集約式高效利用,以及超大規(guī)模AI訓(xùn)練集群可云上獲取,支撐昇騰AI云服務(wù)以更高的算力利用率、更高的算力可用度、更高的吞吐率以及更低的成本,為千行百業(yè)智能化提供充沛且普惠的云上AI算力服務(wù),從而為中國AI算力爭取到了長足的領(lǐng)先空間與發(fā)展窗口。
更值得一提的是,當(dāng)產(chǎn)業(yè)從萬卡向十萬卡集群演進,超節(jié)點修筑AI算力長城的腳步也并未停下。華為云AI峰會上,華為云公布了CloudMatrix 384 超節(jié)點的創(chuàng)新技術(shù)優(yōu)勢。
昇騰云和CloudMatrix 384 超節(jié)點,實現(xiàn)了MoE親和、以網(wǎng)強算、以存強算、長穩(wěn)可靠、朝推夜訓(xùn)、即開即用六大科技創(chuàng)新,這些創(chuàng)新如同“技術(shù)磚石”,穩(wěn)固支撐AI 產(chǎn)業(yè)發(fā)展更進一步,成為AI時代理想的基礎(chǔ)設(shè)施。
為什么這么說?這就要提到各行各業(yè)的AI訓(xùn)推需求,要求云上算力,豎起三道重要的防線:
一是算力充沛的性能防線。
正如杰文斯悖論所說的,Deepseek雖然降低了單個模型對算力的需求,但隨著應(yīng)用AI的用戶越來越多,算力資源的總需求量非但沒有減少,反而進一步增加了。這一背景下,國產(chǎn)AI算力面臨雙重困境,一是單卡性能落后英偉達最新產(chǎn)品,二是多卡集群會“打群架”,堆卡但不增效。而提升算力集群的資源利用率,需要存儲(存力)、網(wǎng)絡(luò)(運力)的共同做功,來適配最新的計算架構(gòu)。
簡單來說,在DeepSeek的推動下,MoE已經(jīng)成為主流大模型共同追求的實踐路徑,所謂MoE架構(gòu),就是從GPT4這樣的少量大專家的超大規(guī)模參數(shù)模型,變成了大量小專家的模式,在每張卡上都部署多個小專家。但傳統(tǒng)架構(gòu)下,MoE模型容易因為專家負(fù)載不均、AllToAll通信延遲等,導(dǎo)致算力浪費,降低資源利用率。
CloudMatrix 384 超節(jié)點的分布式推理平臺可以說是專為MoE大模型而生,具有MoE親和的技術(shù)特性。對比一卡多專家的“小作坊模式”,超節(jié)點通過高速互聯(lián)總線,降低跨機通信損耗,從而實現(xiàn)一卡一專家高效分布式推理,單卡的MoE計算和通信效率都大幅提升。通過聯(lián)接力打破單點算力的性能制約,最大限度地釋放算力共振的能力,也體現(xiàn)了超節(jié)點以網(wǎng)強算的技術(shù)優(yōu)勢。
除了網(wǎng)絡(luò)通訊,顯存容量不高也會制約MoE模型的開發(fā)。大模型推理的不同階段,對計算/訪存的資源需求其實并不一致,比如prefill階段需要高算力,而decode階段需要高防存,但傳統(tǒng)“存算綁定”的模式不夠靈活,就限制了資源利用和性能吞吐。
解決MoE模型的“存力”難題,華為云首創(chuàng)了EMS彈性內(nèi)存存儲,通過內(nèi)存池化技術(shù),實現(xiàn)顯存和算力解綁。一方面,用EMS替代NPU中的顯存,可使得首Token時延降低,最高降幅可達80%;另一方面,當(dāng)NPU的顯存不足時,EMS獨立擴容,不必再通過堆NPU以獲得更多內(nèi)存。同時,EMS還支持算力卸載,這也使得系統(tǒng)吞吐量提升100%。
提高運力以網(wǎng)強算、提高存力以存強算,合力提高綜合計算性能,從而為各行各業(yè)應(yīng)用Deepseek等MoE模型,提供澎湃算力,正是CloudMatrix 384 所筑起的性能防線。
二是算力可靠的穩(wěn)定防線。
解決了性能問題,接下來還解決多卡集群“打群架”的可靠性問題。千卡乃至萬卡級算力集群的運維挑戰(zhàn),已經(jīng)成為算力的關(guān)鍵瓶頸。集群規(guī)模增大,故障頻發(fā),導(dǎo)致訓(xùn)練中斷,模型開發(fā)團隊不得不頻繁執(zhí)行檢查點checkpoint保存操作,這不僅延長了大模型訓(xùn)練周期,還會導(dǎo)致計算資源浪費,開發(fā)成本增高。
構(gòu)建高可靠性的智能運維體系,已成為云上算力長城的必要職責(zé)。對此,華為開發(fā)了昇騰云腦運維“1-3-10”標(biāo)準(zhǔn),即1分鐘感知、3分鐘定界、10分鐘內(nèi)恢復(fù),從而具備了保障長穩(wěn)大模型訓(xùn)練的能力。
也意味著,中國AI有了更具韌性的算力基礎(chǔ)設(shè)施。
三是算力普惠的成本防線。
DeepSeek到來之后,AI推理側(cè)的任務(wù)激增,而訓(xùn)練側(cè)的算力需求則在下降。對于云服務(wù)商來說,針對用戶訪問的潮汐特征(日間推理峰值遠遠大于夜間),做好算力資源的動態(tài)平衡,可以進一步優(yōu)化資源利用效率,避免算力閑置,這樣能夠?qū)崿F(xiàn)綜合成本最優(yōu),最終讓成本優(yōu)勢變成價格優(yōu)勢、普惠能力,為行業(yè)和用戶提供像“水電”一樣實時、普惠、靈活的算力。
目前,華為云已經(jīng)在全國三大樞紐數(shù)據(jù)中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點規(guī)模布局,支持百TB級的帶寬互聯(lián),10毫秒時延圈覆蓋全國19個城市群,讓行業(yè)用戶不需要自建數(shù)據(jù)中心,可以像水電氣一樣,第一時間享受到即開即用的AI算力資源。
同時,華為云通過“訓(xùn)推共池”“靈活調(diào)度”兩大技術(shù),實現(xiàn)朝推夜訓(xùn),白天進行模型推理,晚上閑時進行模型訓(xùn)練,實現(xiàn)了全國超節(jié)點算力資源的“錯峰用電”,算力資源利用率可提升30%以上。
通過性能、穩(wěn)定、普惠的三道防線,華為云CloudMatrix 384 超節(jié)點可以更好地守護各行各業(yè)的智能化需求,成為中國AI巍然挺立的堅實基礎(chǔ)設(shè)施。
正如長城的出現(xiàn),守護了古代中國的國土安全。超節(jié)點通過多項技術(shù)特征的加持,讓以卡為單位的分散式AI算力,走向了集中式AI計算底座,成為真正意義上的下一代AI基礎(chǔ)設(shè)施,一座堅固的云上算力長城。
更宏觀的角度來看,超節(jié)點技術(shù)不僅僅是一項工程性創(chuàng)新,它還徹底改變了芯片制造領(lǐng)域的技術(shù)對壘格局。
英偉達最新推出了基于第五代NVLink技術(shù)的NVL72,并且將其局限在自身生態(tài)當(dāng)中,客觀上構(gòu)成了對中國AI算力的發(fā)展制約。但實際上,我們真正需要的不是芯片本身,而是算力。通過重新定義AI基礎(chǔ)設(shè)施,超節(jié)點技術(shù)為AI算力的供給提供了前所未有的澎湃動力,進而突破了被芯片制程鎖死的AI進程。
在當(dāng)前國際博弈的大背景下,超節(jié)點的出現(xiàn),正是中國應(yīng)對挑戰(zhàn)、把握AI機遇的有力證明。
除了超節(jié)點之外,華為云還在大模型、AI生態(tài)等領(lǐng)域進行了持續(xù)升級,持續(xù)迭代的盤古大模型,已經(jīng)在30多個行業(yè)、400多個場景中應(yīng)用,在制造、金融、政務(wù)、醫(yī)療、制藥、汽車、氣象等七個行業(yè)保持市場規(guī)模領(lǐng)先。
在算力底座、資源調(diào)度、推理服務(wù)及集群可靠四個方面,華為云全面升級昇騰AI云服務(wù),協(xié)助客戶進行模型的開發(fā)、訓(xùn)練、托管和應(yīng)用。目前,昇騰AI云服務(wù)已適配包含DeepSeek在內(nèi)的160多個第三方大模型,并面向政府、金融、互聯(lián)網(wǎng)、零售等行業(yè)服務(wù)600多家創(chuàng)新先鋒企業(yè)。
就像美國的貿(mào)易沖擊,掀不翻中國經(jīng)濟的汪洋大海,美國的一紙禁令,也禁不了昇騰這座云上AI算力長城。
當(dāng)山姆·奧特曼在國會參議院建議要加大AI基礎(chǔ)設(shè)施投入的時候,昇騰AI云服務(wù)已經(jīng)通過超節(jié)點的建設(shè),以及更多技術(shù)、產(chǎn)品、資源的匯集,為接下來的中國AI應(yīng)用大爆發(fā)做好了準(zhǔn)備——下一代AI基礎(chǔ)設(shè)施,就是中國AI走向強大的內(nèi)因。
2025年5月16日,被制裁整整六年的華為依舊在茁壯生長,并且在這些年里拿出了MetaERP、數(shù)據(jù)庫、軟硬件工具鏈等等核心技術(shù)突破。如今超節(jié)點的加入,讓這六年中所有的故事都更加熠熠生輝。
華為的故事在反復(fù)提醒著一件事:我們除了強大,無路可走。
曾幾何時,先進AI算力必然來自西方,被認(rèn)為是一個“鐵律”。但CloudMatrix 384 超節(jié)點的突破,不僅證明了中國可以有自主化的可靠AI算力基礎(chǔ)設(shè)施,更證明了中國AI算力可以實現(xiàn)系統(tǒng)性領(lǐng)先,甚至可以改變企業(yè)用戶的AI算力獲取方式,給全球AI一個更好的算力選擇。
近幾個月,所有國際新聞都在提醒我們,只有當(dāng)自身足夠強大,能夠給自己和他人提供選擇,我們才有話語權(quán),才有交流和談判的空間,才能為多元、開放與平等添加一份保障。
從這個意義來說,CloudMatrix 384 超節(jié)點就如同AI世界中的長城。它佇立在那里,確保了全球AI的自由勃發(fā)與平等成長。
巍巍昆侖,翼翼長城。一些源于中國文化的智慧,一些來自中國科技的態(tài)度,此刻正無言流淌在奔騰的AI算力中,相信它們很快會被世界讀懂。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。