光電路交換何以成為 AI 數(shù)據(jù)中心剛需
本文要點(diǎn)
傳統(tǒng)電交換架構(gòu)難以適配 AI 算力負(fù)載的核心原因
光電路交換如何降低時(shí)延、削減功耗并簡(jiǎn)化網(wǎng)絡(luò)架構(gòu)
固態(tài)超構(gòu)表面光束調(diào)控技術(shù)成為規(guī)?;饨粨Q的核心支撐
光電路交換與現(xiàn)有數(shù)據(jù)中心網(wǎng)絡(luò)的融合落地方式
此前擴(kuò)容 AI 集群,只需增設(shè)數(shù)百顆加速芯片并微調(diào)網(wǎng)絡(luò)架構(gòu)即可,如今這套模式早已行不通?,F(xiàn)階段 AI 算力集群動(dòng)輒搭載數(shù)萬(wàn)個(gè) GPU,超大型集群更是朝著數(shù)十萬(wàn) GPU 規(guī)模邁進(jìn)。
在此體量下,網(wǎng)絡(luò)架構(gòu)直接決定整機(jī)算力性能上限。
行業(yè)真正的痛點(diǎn)在于架構(gòu)層面:絕大多數(shù)數(shù)據(jù)中心仍沿用胖樹(shù)、克洛斯等多層級(jí)電交換組網(wǎng)架構(gòu),這類(lèi)架構(gòu)適配流量雜亂無(wú)規(guī)律的傳統(tǒng)業(yè)務(wù),但與 AI 訓(xùn)練業(yè)務(wù)流量特征完全相悖。
AI 訓(xùn)練任務(wù)會(huì)在各組加速芯片之間產(chǎn)生大流量、高穩(wěn)定度的東西向橫向數(shù)據(jù)流,且訓(xùn)練全程要求各節(jié)點(diǎn)數(shù)據(jù)同步協(xié)同。數(shù)據(jù)每經(jīng)過(guò)一級(jí)電交換機(jī)都會(huì)產(chǎn)生時(shí)延,一次次光電 / 電光(OEO)信號(hào)轉(zhuǎn)換也會(huì)造成大量電能損耗。
隨著集群規(guī)模不斷擴(kuò)張,網(wǎng)絡(luò)數(shù)據(jù)傳輸能耗已從次要運(yùn)維成本,升級(jí)為核心設(shè)計(jì)約束條件。在大型 AI 算力部署場(chǎng)景中,網(wǎng)絡(luò)設(shè)備耗電量在整體系統(tǒng)能耗中占比大幅攀升。
行業(yè)由此產(chǎn)生深層架構(gòu)思考:海量數(shù)據(jù)流量是否必須層層轉(zhuǎn)發(fā)分包處理?能否找到可實(shí)現(xiàn)大規(guī)模算力資源直連的更高效組網(wǎng)方案?
光電路交換迎來(lái)普及契機(jī)
光電路交換(OCS)采用與傳統(tǒng)組網(wǎng)截然不同的搭建邏輯。它不再對(duì)單個(gè)數(shù)據(jù)包逐級(jí)路由轉(zhuǎn)發(fā),而是在通信端點(diǎn)之間建立專(zhuān)屬直達(dá)光通路。通路建成后,數(shù)據(jù)流可無(wú)間斷傳輸,全程無(wú)需反復(fù)報(bào)文檢測(cè)與數(shù)據(jù)緩存。

圖1 隨著人工智能系統(tǒng)的不斷發(fā)展,網(wǎng)絡(luò)正成為影響性能和效率的關(guān)鍵因素,而光電路交換技術(shù)則成為一種解決方案。
對(duì)于 AI 訓(xùn)練業(yè)務(wù)而言該優(yōu)勢(shì)尤為突出:訓(xùn)練作業(yè)需反復(fù)傳輸海量高頻復(fù)用數(shù)據(jù),網(wǎng)絡(luò)可在任務(wù)運(yùn)行期間固定搭建專(zhuān)屬傳輸光路,業(yè)務(wù)切換時(shí)再重新調(diào)配鏈路。此舉能大幅提升帶寬利用率、降低網(wǎng)絡(luò)超額訂閱比例,顯著降低單位數(shù)據(jù)傳輸能耗。
光電路交換并非新興概念,早在 21 世紀(jì)初就已成為重點(diǎn)研究方向,早年多依靠微機(jī)電系統(tǒng)(MEMS)反射鏡陣列實(shí)現(xiàn)光纖端口光路切換。但初代方案存在諸多落地難題:機(jī)械結(jié)構(gòu)復(fù)雜導(dǎo)致端口擴(kuò)容受限、制造成本高昂、長(zhǎng)期運(yùn)行穩(wěn)定性不足。疊加同期電交換技術(shù)飛速迭代,光電路交換長(zhǎng)期處于小眾應(yīng)用狀態(tài)。
近幾年行業(yè)形勢(shì)發(fā)生重大轉(zhuǎn)變:AI 基礎(chǔ)設(shè)施規(guī)模突破臨界點(diǎn),訓(xùn)練業(yè)務(wù)流量特征徹底擊穿傳統(tǒng)網(wǎng)絡(luò)承載上限;網(wǎng)絡(luò)能耗從運(yùn)維問(wèn)題升級(jí)為架構(gòu)設(shè)計(jì)硬性指標(biāo);更關(guān)鍵的是,固態(tài)光束調(diào)控技術(shù)日趨成熟,徹底掃清了早年制約光電路交換規(guī)?;涞氐母黝?lèi)現(xiàn)實(shí)障礙。
多重趨勢(shì)疊加之下,光電路交換重回行業(yè)視野,且承擔(dān)的架構(gòu)定位遠(yuǎn)比最初設(shè)想更為核心。
重構(gòu)交換端口規(guī)模與網(wǎng)絡(luò)層級(jí)
數(shù)十年來(lái),數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)始終受交換芯片硬件規(guī)格制約。單顆專(zhuān)用集成電路芯片端口數(shù)量固定,僅 32 口、64 口乃至 128 口,大規(guī)模網(wǎng)絡(luò)只能依靠設(shè)備堆疊形成多層級(jí)組網(wǎng)。集群規(guī)模越大,網(wǎng)絡(luò)層級(jí)越多。
而超構(gòu)表面固態(tài)可編程光學(xué)等新興技術(shù),徹底打破這一固有設(shè)計(jì)思維,解鎖全新組網(wǎng)架構(gòu)思路。
當(dāng)交換設(shè)備端口規(guī)模從數(shù)百口邁向數(shù)千口,傳統(tǒng)組網(wǎng)邏輯隨之改變,多層級(jí)堆疊架構(gòu)不再剛需,大型算力集群可實(shí)現(xiàn)扁平化組網(wǎng)。
大端口交換架構(gòu)能有效減少數(shù)據(jù)轉(zhuǎn)發(fā)跳數(shù)、壓低傳輸時(shí)延,部分場(chǎng)景甚至可直接精簡(jiǎn)刪減多層報(bào)文處理節(jié)點(diǎn)。以往依靠流量調(diào)度優(yōu)化緩解的網(wǎng)絡(luò)超額訂閱問(wèn)題,如今可通過(guò)交換架構(gòu)本身從根源解決。
在輕量化部署場(chǎng)景中,256×256 規(guī)格緊湊型光交換機(jī)可直接部署在機(jī)柜內(nèi)部,依托軟件靈活重組機(jī)柜內(nèi)加速芯片組網(wǎng)形態(tài),適配不同算力任務(wù);面向超大規(guī)模 AI 集群,萬(wàn)口級(jí)超大光交換矩陣可充當(dāng)全局可重構(gòu)骨干網(wǎng)絡(luò)。
該技術(shù)帶來(lái)的價(jià)值遠(yuǎn)不止帶寬提升,更為超大型數(shù)據(jù)中心組網(wǎng)開(kāi)辟全新設(shè)計(jì)思路。
行業(yè)性能瓶頸發(fā)生轉(zhuǎn)移
以往行業(yè)研討光通信基建,多聚焦插入損耗、鏈路功率預(yù)算等基礎(chǔ)參數(shù),這類(lèi)指標(biāo)固然重要,但當(dāng)下 AI 算力基建的核心約束條件已然轉(zhuǎn)變。
光模塊技術(shù)迭代提速,共封裝光學(xué)、新一代插拔式光模塊持續(xù)優(yōu)化鏈路傳輸效率,突破電信號(hào)傳輸距離局限。鏈路層性能完善后,行業(yè)研發(fā)重心開(kāi)始向上層網(wǎng)絡(luò)架構(gòu)轉(zhuǎn)移。

圖2 光路切換為人工智能數(shù)據(jù)中心開(kāi)辟了新的可能性。
傳輸效率提升后,行業(yè)聚焦四大核心問(wèn)題:
1. 光交換矩陣可實(shí)現(xiàn)的最大實(shí)用端口規(guī)模
2. 網(wǎng)絡(luò)連通性適配算力任務(wù)部署的響應(yīng)速度
3. 精簡(jiǎn)冗余網(wǎng)絡(luò)層級(jí)的可行性
4. 刪減無(wú)效報(bào)文處理層級(jí)后可削減的能耗規(guī)模
以超構(gòu)表面光束調(diào)控為代表的固態(tài)可編程光學(xué)技術(shù),成為破解以上難題的關(guān)鍵。該類(lèi)器件無(wú)機(jī)械運(yùn)動(dòng)部件,依托電控方式靈活調(diào)控光路,相比傳統(tǒng)機(jī)械式光交換設(shè)備,可靠性與可擴(kuò)展性全面占優(yōu)。
同時(shí)該技術(shù)支持通過(guò)軟件自由定義、實(shí)時(shí)調(diào)整組網(wǎng)連通形態(tài),摒棄固定拓?fù)浣M網(wǎng)模式,讓網(wǎng)絡(luò)架構(gòu)主動(dòng)適配算力資源調(diào)度邏輯。
光電路交換與現(xiàn)有網(wǎng)絡(luò)融合落地
光電路交換并非用來(lái)徹底取代分組電交換網(wǎng)絡(luò),而是作為互補(bǔ)方案融入現(xiàn)有組網(wǎng)體系。
短時(shí)突發(fā)流量、網(wǎng)絡(luò)管控?cái)?shù)據(jù)流、精細(xì)化路由調(diào)度業(yè)務(wù)依舊由電交換機(jī)承載;大帶寬、長(zhǎng)時(shí)長(zhǎng)、高穩(wěn)定的 AI 訓(xùn)練主力數(shù)據(jù)流,則交由光電路通路承載。
最終形成光電混合組網(wǎng)架構(gòu):海量高速數(shù)據(jù)流繞過(guò)擁堵的多層報(bào)文轉(zhuǎn)發(fā)網(wǎng)絡(luò),原有網(wǎng)絡(luò)管控平面完整保留。光電路交換系統(tǒng)可與集群調(diào)度平臺(tái)、軟件定義網(wǎng)絡(luò)控制器聯(lián)動(dòng),實(shí)現(xiàn)網(wǎng)絡(luò)連通形態(tài)隨算力任務(wù)動(dòng)態(tài)調(diào)整。
調(diào)度系統(tǒng)、網(wǎng)絡(luò)架構(gòu)與光學(xué)傳輸技術(shù)深度融合,標(biāo)志著算力基建設(shè)計(jì)迎來(lái)全新變革:網(wǎng)絡(luò)不再固守固定架構(gòu),轉(zhuǎn)而主動(dòng)適配上層應(yīng)用業(yè)務(wù)流量特征。
行業(yè)發(fā)展展望
光電路交換理論早已成熟,如今真正改變行業(yè)格局的,是超大規(guī)模 AI 算力集群的實(shí)際落地需求。
隨著 AI 集群體量持續(xù)擴(kuò)張,沿用多年的傳統(tǒng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)理念被逐一推翻,以往不具備實(shí)用性的超大端口交換方案,正式進(jìn)入工程落地研討階段,諸多傳統(tǒng)必備網(wǎng)絡(luò)層級(jí)也迎來(lái)精簡(jiǎn)優(yōu)化空間。
未來(lái) AI 數(shù)據(jù)中心將逐步擺脫僵化的多層級(jí)電互聯(lián)架構(gòu),轉(zhuǎn)型為靈活可調(diào)的光學(xué)組網(wǎng)體系,讓網(wǎng)絡(luò)架構(gòu)服務(wù)于算力調(diào)度,而非制約算力發(fā)展。
在此趨勢(shì)下,網(wǎng)絡(luò)升級(jí)為可隨業(yè)務(wù)動(dòng)態(tài)調(diào)整的柔性基建,光電路交換也從備選組網(wǎng)方案,正式升級(jí)為搭建頂級(jí)超大規(guī)模 AI 算力系統(tǒng)的核心基礎(chǔ)架構(gòu)。










評(píng)論