中國(guó)電信近日宣布,在北京成功完成全球首個(gè)50毫秒波長(zhǎng)交換光網(wǎng)絡(luò)(WSON)算力互聯(lián)現(xiàn)網(wǎng)驗(yàn)證,標(biāo)志著我國(guó)在算力網(wǎng)絡(luò)高可靠承載領(lǐng)域取得重大突破。此次驗(yàn)證通過(guò)構(gòu)建跨域分布式人工智能訓(xùn)練場(chǎng)景,實(shí)現(xiàn)了超過(guò)1200公里的光網(wǎng)絡(luò)可靠傳輸,為AI大模型訓(xùn)練提供了關(guān)鍵技術(shù)支撐。
隨著人工智能技術(shù)快速發(fā)展,AI大模型訓(xùn)練對(duì)底層網(wǎng)絡(luò)的穩(wěn)定性提出極高要求。網(wǎng)絡(luò)傳輸中的微小丟包或短暫中斷,可能導(dǎo)致持續(xù)數(shù)日、消耗大量能源的訓(xùn)練任務(wù)失敗,給企業(yè)帶來(lái)巨大損失。傳統(tǒng)網(wǎng)絡(luò)保護(hù)機(jī)制已難以滿足AI場(chǎng)景對(duì)毫秒級(jí)響應(yīng)的需求,成為制約算力互聯(lián)的關(guān)鍵瓶頸。
為解決這一難題,中國(guó)電信北京公司聯(lián)合科研團(tuán)隊(duì),將深度學(xué)習(xí)與智能決策算法深度融入WSON控制平面,構(gòu)建了"感知-決策-執(zhí)行"三位一體的智能閉環(huán)系統(tǒng)。當(dāng)網(wǎng)絡(luò)發(fā)生故障時(shí),該系統(tǒng)可在50毫秒內(nèi)自動(dòng)完成光路徑重新計(jì)算與切換,確保業(yè)務(wù)傳輸零中斷。這項(xiàng)技術(shù)突破使算力網(wǎng)絡(luò)具備自我修復(fù)能力,顯著提升了系統(tǒng)生存性。
驗(yàn)證過(guò)程采用真實(shí)網(wǎng)絡(luò)環(huán)境,通過(guò)級(jí)聯(lián)多個(gè)部署WSON 50ms技術(shù)的光纖鏈路,構(gòu)建了橫跨1200公里的分布式訓(xùn)練場(chǎng)景。測(cè)試模擬了北京與異地?cái)?shù)據(jù)中心協(xié)同訓(xùn)練大模型的任務(wù),全面檢驗(yàn)了系統(tǒng)在超長(zhǎng)距傳輸下的性能表現(xiàn)。實(shí)驗(yàn)數(shù)據(jù)顯示,結(jié)合800G高速傳輸與無(wú)損調(diào)度技術(shù)后,網(wǎng)絡(luò)吞吐率保持極高水平,分布式訓(xùn)練效率達(dá)到單中心訓(xùn)練的97%以上。
這項(xiàng)技術(shù)突破具有重要應(yīng)用價(jià)值。在醫(yī)療領(lǐng)域,遠(yuǎn)程手術(shù)指導(dǎo)系統(tǒng)對(duì)網(wǎng)絡(luò)時(shí)延和可靠性要求極高;金融行業(yè)的高頻交易系統(tǒng)需要毫秒級(jí)響應(yīng);政務(wù)服務(wù)中的關(guān)鍵數(shù)據(jù)傳輸不容中斷。WSON保護(hù)機(jī)制可為這些行業(yè)提供確定性算力保障,推動(dòng)算力網(wǎng)絡(luò)向高可靠、低時(shí)延方向演進(jìn)。
此次現(xiàn)網(wǎng)驗(yàn)證的成功,不僅驗(yàn)證了50毫秒級(jí)光網(wǎng)絡(luò)保護(hù)技術(shù)的可行性,更為構(gòu)建全國(guó)一體化算力網(wǎng)絡(luò)提供了關(guān)鍵技術(shù)方案。隨著東數(shù)西算工程深入推進(jìn),該技術(shù)有望在跨區(qū)域算力調(diào)度中發(fā)揮重要作用,助力我國(guó)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。











