昇騰384超節(jié)點:業(yè)界最大規(guī)模高速總線互聯(lián)超節(jié)點,突破AI算力互聯(lián)瓶頸

2025年5月23日,在備受矚目的鯤鵬昇騰開發(fā)者大會2025—昇騰AI開發(fā)者峰會上,華為重磅推出昇騰超節(jié)點技術,成功實現(xiàn)業(yè)界最大規(guī)模的384卡高速總線互聯(lián),為人工智能領域帶來全新變革,正式開啟AI新紀元。

昇騰384超節(jié)點:業(yè)界最大規(guī)模高速總線互聯(lián)超節(jié)點,突破AI算力互聯(lián)瓶頸

當前,大模型發(fā)展呈現(xiàn)參數(shù)與效率交替演進的態(tài)勢。一方面,Scaling Law不斷推動模型能力突破極限;另一方面,以DeepSeek為代表的創(chuàng)新架構與工程技術,正加速模型能力在千行萬業(yè)的落地應用。在此背景下,MoE成為主流模型結構,其復雜的混合并行策略帶來巨大挑戰(zhàn),TP、SP、EP單次通信量高達GB級且難以掩蓋。隨著并行規(guī)模持續(xù)擴大,傳統(tǒng)服務器跨機帶寬已成為訓練的核心阻礙,亟需計算架構的創(chuàng)新升級以適配未來模型發(fā)展。

傳統(tǒng)服務器依賴以太網絡實現(xiàn)跨機互聯(lián),通信帶寬較低。實踐表明,當TP、SP或EP等分布式策略的混合并行域超過8卡時,跨機通信帶寬便成為性能瓶頸,導致系統(tǒng)性能大幅下降。

華為昇騰超節(jié)點打破了以CPU為中心的馮諾依曼架構,創(chuàng)新提出了對等計算架構,憑借高速總線互聯(lián)技術實現(xiàn)重大突破,把總線從服務器內部,擴展到整機柜、甚至跨機柜。在超節(jié)點范圍內,用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升了15倍;單跳通信時延也從2微秒做到200納秒,降低了10倍,使集群如同一臺計算機般協(xié)同工作,有效突破系統(tǒng)性能限制。

此次推出的昇騰384超節(jié)點,由12個計算柜和4個總線柜構成,是目前業(yè)界規(guī)模最大的超節(jié)點。依托華為在ICT領域深厚的技術與工程經驗,通過最佳負載均衡組網方案,該超節(jié)點可進一步擴展為包含數(shù)萬卡的Atlas 900 SuperCluster超節(jié)點集群,為未來更大規(guī)模的模型演進提供有力支撐。

性能測試數(shù)據(jù)顯示,在昇騰超節(jié)點集群上,LLaMA 3等千億稠密模型性能相比傳統(tǒng)集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模態(tài)、MoE模型上,性能提升可達3倍以上,較業(yè)界其他集群高出1.2倍,在行業(yè)中處于領先地位。

華為表示,未來將持續(xù)加大創(chuàng)新力度,攜手全球開發(fā)者在昇騰社區(qū)共同構建智能時代高效算力底座,為千行萬業(yè)的大模型創(chuàng)新提供強勁動力,推動人工智能技術在更多領域的深度應用與發(fā)展。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-05-28
昇騰384超節(jié)點:業(yè)界最大規(guī)模高速總線互聯(lián)超節(jié)點,突破AI算力互聯(lián)瓶頸
2025年5月23日,在備受矚目的鯤鵬昇騰開發(fā)者大會2025—昇騰AI開發(fā)者峰會上,華為重磅推出昇騰超節(jié)點技術,成功實現(xiàn)業(yè)界最大規(guī)模的384卡高速總

長按掃碼 閱讀全文