當(dāng)工程師們打開英偉達(dá)最新一代NVL72機(jī)柜的后蓋時,首先映入眼簾的不是密集排列的72顆GPU,而是由超過5000根同軸銅纜編織而成的復(fù)雜網(wǎng)絡(luò)。這些總長度超過3.2公里的銅纜,不僅構(gòu)成了機(jī)柜內(nèi)部的主要連接結(jié)構(gòu),更占據(jù)了整個設(shè)備1.36噸自重的相當(dāng)比例。這種設(shè)計背后,折射出的是當(dāng)前高性能計算領(lǐng)域面臨的物理極限挑戰(zhàn)。
機(jī)柜中央位置安裝的9塊NVSwitch托盤,被上下各9塊計算托盤緊密環(huán)繞。這種布局并非偶然,而是基于銅纜信號傳輸特性的精確計算——在1.8TB/s的超高帶寬下,銅纜信號的有效傳輸距離僅有數(shù)英尺。為確保所有GPU都能獲得最優(yōu)連接,工程師們不得不將交換芯片置于物理中心位置,使每個計算單元到交換節(jié)點的距離保持最短。
兩年前英偉達(dá)首次展示NVL72時,銅纜連接方案曾被視為技術(shù)突破。網(wǎng)絡(luò)部門高級副總裁Gilad Shainer當(dāng)時向媒體強(qiáng)調(diào):"銅纜在可用場景下是最優(yōu)選擇,它成本低廉且無需額外功耗。"這種設(shè)計確實帶來了顯著優(yōu)勢:相比光模塊方案,整套系統(tǒng)節(jié)省了約20千瓦功耗,相當(dāng)于避免了16%的額外能源消耗。在可靠性方面,無源銅纜連接在百萬級鏈路規(guī)模下,故障率比可插拔光模塊低兩個數(shù)量級。
但技術(shù)演進(jìn)很快暴露了銅纜方案的局限性。隨著AI模型規(guī)模呈指數(shù)級增長,單個計算域需要容納的GPU數(shù)量從72顆躍升至數(shù)千顆。NVL72雖然通過銅背板實現(xiàn)了機(jī)柜內(nèi)全互連,但跨機(jī)柜連接仍需依賴傳統(tǒng)InfiniBand或以太網(wǎng),導(dǎo)致帶寬和延遲性能出現(xiàn)斷崖式下降。信號衰減問題在銅纜方案中尤為突出,1.8TB/s帶寬下的有效傳輸距離不足一米,這直接限制了系統(tǒng)擴(kuò)展能力。
光互連技術(shù)的突破為突破物理極限提供了可能。2025年英偉達(dá)在Spectrum以太網(wǎng)交換機(jī)和Quantum InfiniBand交換機(jī)上首次量產(chǎn)共封裝光學(xué)(CPO)技術(shù),通過將光引擎直接集成到交換芯片封裝內(nèi),成功將單個光模塊的功耗從10-15瓦降至3瓦以下,體積縮小至傳統(tǒng)方案的1/3。這種技術(shù)革新為NVLink網(wǎng)絡(luò)的光學(xué)升級奠定了基礎(chǔ)。
在2026年GTC大會上,英偉達(dá)推出了革命性的混合連接方案。新發(fā)布的Vera Rubin NVL576系統(tǒng)采用分層架構(gòu):機(jī)柜內(nèi)部GPU與交換機(jī)仍保持銅纜連接,確保低成本和高可靠性;機(jī)柜間則通過光模塊實現(xiàn)高速互連,突破物理距離限制。這種設(shè)計使計算域規(guī)模從72顆GPU擴(kuò)展至576顆,而功耗僅增加12%。更激進(jìn)的Rosa Feynman NVL1152系統(tǒng)則計劃在GPU封裝層面引入CPO技術(shù),預(yù)計可將延遲降低40%。
供應(yīng)鏈布局成為決定技術(shù)落地的關(guān)鍵因素。英偉達(dá)在一個月內(nèi)完成三筆戰(zhàn)略投資:向Coherent和Lumentum各注資20億美元鎖定激光器產(chǎn)能,其中Coherent將利用投資將磷化銦晶圓產(chǎn)能翻倍;另向Marvell投資20億美元開發(fā)硅光子技術(shù),后者通過收購Celestial AI獲得的光子互連技術(shù),有望構(gòu)建跨機(jī)柜的一致性內(nèi)存網(wǎng)絡(luò)。這三筆投資總計60億美元,精準(zhǔn)卡位光學(xué)供應(yīng)鏈最稀缺環(huán)節(jié)。
競爭對手的開放標(biāo)準(zhǔn)聯(lián)盟面臨嚴(yán)峻挑戰(zhàn)。由AMD、Intel等公司推動的UALink標(biāo)準(zhǔn),其硬件產(chǎn)品最早要到2026年底才能試產(chǎn),規(guī)模部署可能推遲至2027年。而英偉達(dá)通過提前鎖定關(guān)鍵光學(xué)元件產(chǎn)能,已在供應(yīng)鏈層面建立顯著優(yōu)勢。分析機(jī)構(gòu)指出,當(dāng)開放標(biāo)準(zhǔn)硬件最終量產(chǎn)時,英偉達(dá)可能已占據(jù)全球CPO激光器產(chǎn)能的35%以上。
盡管全面轉(zhuǎn)向光學(xué)互連,英偉達(dá)并未完全放棄銅纜技術(shù)。在機(jī)柜內(nèi)部GPU到交換機(jī)的短距離連接場景中,銅背板方案仍保持著成本和可靠性優(yōu)勢。這種技術(shù)選擇折射出務(wù)實態(tài)度:在物理極限范圍內(nèi)繼續(xù)優(yōu)化成熟方案,同時通過光學(xué)創(chuàng)新突破系統(tǒng)規(guī)模瓶頸。正如網(wǎng)絡(luò)部門負(fù)責(zé)人所言:"銅纜仍是最佳選擇,前提是傳輸距離在物理允許范圍內(nèi)。"











