超級以太網(wǎng)的興起:推動下一代人工智能工作負載

隨著人工智能(AI)和高性能計算(HPC)的快速發(fā)展,對網(wǎng)絡基礎設施的要求越來越高。傳統(tǒng)的以太網(wǎng)技術在面對大規(guī)模并行計算和海量數(shù)據(jù)傳輸時逐漸暴露出性能瓶頸。為了解決這些問題,超級以太網(wǎng)(UltraEthernet)應運而生。超級以太網(wǎng)通過優(yōu)化網(wǎng)絡架構(gòu)和協(xié)議棧,大幅提升了網(wǎng)絡性能,為下一代人工智能工作負載提供了強大的支持。

超級以太網(wǎng)的背景與需求

人工智能與高性能計算的挑戰(zhàn)

現(xiàn)代人工智能模型的規(guī)模和復雜性不斷增加,例如,一些生成式AI模型的參數(shù)量已達到數(shù)萬億個。這些模型的訓練和推理需要在大規(guī)模計算集群上進行,對網(wǎng)絡的帶寬、延遲和可擴展性提出了極高要求。傳統(tǒng)的以太網(wǎng)技術在面對這些需求時,往往無法滿足高性能計算和AI工作負載的苛刻要求。

超級以太網(wǎng)聯(lián)盟的成立

為了應對這些挑戰(zhàn),2023年7月,Linux基金會宣布成立超級以太網(wǎng)聯(lián)盟(UltraEthernetConsortium,UEC),其創(chuàng)始成員包括英特爾、AMD、惠普企業(yè)、Arista、Broadcom、思科、Meta和微軟等。該聯(lián)盟的目標是開發(fā)一個基于以太網(wǎng)的開放、可互操作、高性能的全通信堆棧架構(gòu),以滿足大規(guī)模人工智能和高性能計算的網(wǎng)絡需求。

超級以太網(wǎng)的技術特點

優(yōu)化的傳輸層協(xié)議

超級以太網(wǎng)聯(lián)盟計劃開發(fā)一種新的傳輸層協(xié)議——超級以太網(wǎng)傳輸(UltraEthernetTransport,UET),以取代現(xiàn)有的基于以太網(wǎng)的RDMAoverConvergedEthernet(RoCE)協(xié)議。UET協(xié)議將支持以下特性:

多路徑和分組噴射:通過同時利用所有可用路徑傳輸數(shù)據(jù)包,實現(xiàn)更高效的網(wǎng)絡利用率。

靈活的傳輸順序:允許數(shù)據(jù)包亂序傳輸,減少尾延遲。

現(xiàn)代擁塞控制機制:優(yōu)化網(wǎng)絡擁塞管理,確保在高負載下仍能保持低延遲。

增強的物理層和鏈路層

超級以太網(wǎng)不僅優(yōu)化了傳輸層協(xié)議,還對物理層和鏈路層進行了改進。這些改進包括更高的帶寬、更低的延遲以及更高效的信號傳輸技術。通過這些優(yōu)化,超級以太網(wǎng)能夠在硬件層面大幅提升網(wǎng)絡性能,滿足大規(guī)模AI和HPC工作負載的需求。

軟件層的優(yōu)化

超級以太網(wǎng)的軟件層優(yōu)化主要體現(xiàn)在對AI和HPC工作負載的深度支持上。聯(lián)盟正在開發(fā)相關的API和數(shù)據(jù)結(jié)構(gòu),以確保超級以太網(wǎng)能夠無縫集成到現(xiàn)有的AI框架和HPC庫中。這意味著用戶無需對現(xiàn)有的工作負載進行大規(guī)模修改,即可遷移到超級以太網(wǎng)架構(gòu)。

超級以太網(wǎng)的應用案例

數(shù)據(jù)中心網(wǎng)絡優(yōu)化

超級以太網(wǎng)在數(shù)據(jù)中心的應用主要體現(xiàn)在對網(wǎng)絡架構(gòu)的優(yōu)化上。通過采用超級以太網(wǎng)技術,數(shù)據(jù)中心能夠?qū)崿F(xiàn)更高的網(wǎng)絡利用率和更低的延遲。例如,騰訊云在實踐中通過優(yōu)化網(wǎng)絡架構(gòu),實現(xiàn)了超過90%的網(wǎng)絡利用率。這種優(yōu)化不僅降低了數(shù)據(jù)中心的運營成本,還顯著提升了AI訓練的效率。

大規(guī)模AI訓練

在大規(guī)模AI訓練場景中,超級以太網(wǎng)能夠顯著提升模型訓練的速度和效率。通過支持多路徑傳輸和靈活的分組順序,超級以太網(wǎng)能夠更好地應對大規(guī)模并行計算中的數(shù)據(jù)傳輸需求。例如,NVIDIA推出的BlueField-3SuperNIC和Spectrum-4交換機系統(tǒng),專為AI工作負載優(yōu)化,能夠提供高達400Gb/s的網(wǎng)絡帶寬。

高性能計算

超級以太網(wǎng)在高性能計算中的應用主要體現(xiàn)在對計算集群的優(yōu)化上。通過采用超級以太網(wǎng)技術,計算集群能夠?qū)崿F(xiàn)更高的計算效率和更低的延遲。例如,惠普企業(yè)(HPE)正在利用超級以太網(wǎng)技術優(yōu)化其高性能計算解決方案,以滿足大規(guī)??茖W計算和工程模擬的需求。

超級以太網(wǎng)的優(yōu)勢

高性能

超級以太網(wǎng)通過優(yōu)化傳輸層協(xié)議和物理層技術,大幅提升了網(wǎng)絡的帶寬和延遲性能。例如,NVIDIA的SuperNIC能夠提供高達800Gb/s的網(wǎng)絡帶寬,顯著提升了AI工作負載的效率。

可擴展性

超級以太網(wǎng)的架構(gòu)設計使其能夠輕松擴展以滿足大規(guī)模計算需求。通過支持多路徑傳輸和靈活的分組順序,超級以太網(wǎng)能夠在大規(guī)模計算集群中實現(xiàn)高效的負載均衡。

互操作性

超級以太網(wǎng)聯(lián)盟致力于開發(fā)一個開放、可互操作的網(wǎng)絡架構(gòu)。這意味著不同的硬件和軟件供應商能夠在其基礎上開發(fā)兼容的產(chǎn)品,從而推動整個行業(yè)的技術創(chuàng)新。

成本效益

超級以太網(wǎng)在提升性能的同時,還注重成本效益。通過優(yōu)化網(wǎng)絡架構(gòu)和協(xié)議棧,超級以太網(wǎng)能夠在不增加過多成本的情況下,顯著提升網(wǎng)絡性能。例如,騰訊云通過優(yōu)化網(wǎng)絡架構(gòu),實現(xiàn)了超過90%的網(wǎng)絡利用率,顯著降低了數(shù)據(jù)中心的運營成本。

超級以太網(wǎng)的未來展望

技術創(chuàng)新

超級以太網(wǎng)聯(lián)盟正在不斷推進技術創(chuàng)新,以滿足未來人工智能和高性能計算的需求。例如,聯(lián)盟正在開發(fā)新的傳輸層協(xié)議和優(yōu)化的物理層技術,以進一步提升網(wǎng)絡性能。

行業(yè)合作

超級以太網(wǎng)的發(fā)展離不開行業(yè)的廣泛合作。聯(lián)盟成員包括英特爾、AMD、惠普企業(yè)、Arista、Broadcom、思科、Meta和微軟等。這些行業(yè)巨頭的合作將推動超級以太網(wǎng)技術的快速普及和應用。

市場前景

隨著人工智能和高性能計算市場的快速增長,超級以太網(wǎng)的市場前景廣闊。研究公司650Group預計,數(shù)據(jù)中心AI網(wǎng)絡市場規(guī)模將在未來幾年內(nèi)顯著增長。超級以太網(wǎng)技術的普及將為相關企業(yè)帶來巨大的市場機會。

總結(jié)

超級以太網(wǎng)的興起為下一代人工智能和高性能計算工作負載提供了強大的支持。通過優(yōu)化傳輸層協(xié)議、增強物理層和鏈路層以及優(yōu)化軟件層,超級以太網(wǎng)能夠顯著提升網(wǎng)絡性能。在數(shù)據(jù)中心、大規(guī)模AI訓練和高性能計算等領域,超級以太網(wǎng)已經(jīng)展現(xiàn)出顯著的優(yōu)勢。隨著技術創(chuàng)新的不斷推進和行業(yè)的廣泛合作,超級以太網(wǎng)將在未來發(fā)揮更大的作用。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2025-05-06
超級以太網(wǎng)的興起:推動下一代人工智能工作負載
超級以太網(wǎng)的興起為下一代人工智能和高性能計算工作負載提供了強大的支持。通過優(yōu)化傳輸層協(xié)議、增強物理層和鏈路層以及優(yōu)化軟件層,超級以太網(wǎng)能夠顯著提升網(wǎng)絡性能。在數(shù)據(jù)中心、大規(guī)模AI訓練和高性能計算等領域,超級以太網(wǎng)已經(jīng)展現(xiàn)出顯著的優(yōu)勢。隨著技術創(chuàng)新的不斷推進和行業(yè)的廣泛合作,超級以太網(wǎng)將在未來發(fā)揮更大的作用。

長按掃碼 閱讀全文