UALinkSec合規(guī)IP為AI集群的UALink 鏈路構(gòu)建安全防護(hù)
網(wǎng)絡(luò)領(lǐng)域的經(jīng)典難題是通過數(shù)據(jù)加密保障連接安全,但以線速運(yùn)行高強(qiáng)度加密算法往往會(huì)影響性能;而如果搭建超高速互聯(lián)鏈路卻缺乏加密策略,系統(tǒng)又會(huì)面臨安全漏洞。包含新思科技在內(nèi)的 UALink 聯(lián)盟架構(gòu)師們深知這一課題的關(guān)鍵。UALink 協(xié)議為點(diǎn)對(duì)點(diǎn)加速器鏈路制定了交換式架構(gòu)標(biāo)準(zhǔn),可將 AI 集群擴(kuò)展至 1024 個(gè)加速器,而最新的 UALink 200G 規(guī)范進(jìn)一步完善了 UALinkSec 安全框架。作為旗下 UALink 控制器 IP 和高性能 224G 物理層(PHY)IP 的配套產(chǎn)品,新思科技推出了 UALinkSec_200 安全模塊,這是首款符合 UALink 安全規(guī)范的落地實(shí)現(xiàn)方案。
為 UALink 網(wǎng)絡(luò)層集成 UALinkSec 安全組件
UALink 協(xié)議沿用了標(biāo)準(zhǔn)以太網(wǎng)的物理層(PHY),并新增了專屬的鏈路層、事務(wù)層和協(xié)議層,為點(diǎn)對(duì)點(diǎn)連接打造多項(xiàng)高級(jí)特性。這一物理層的選型設(shè)計(jì),使其能直接復(fù)用符合以太網(wǎng) 802.3dj 標(biāo)準(zhǔn)的物理層組件,其中就包括新思科技的 224G PHY IP。低延遲是 UALink 協(xié)議的核心設(shè)計(jì)考量,而一系列簡(jiǎn)化設(shè)定進(jìn)一步保障了這一特性:固定有效載荷為 64 字節(jié)或 640 字節(jié);線纜長(zhǎng)度限制在 4 米以內(nèi);終端節(jié)點(diǎn)數(shù)量不超過 1024 個(gè)。鏈路層重傳機(jī)制和基于信用量的流控技術(shù)保障了數(shù)據(jù)的連續(xù)傳輸,且重傳響應(yīng)時(shí)間可控制在 1 微秒以內(nèi)。以下是基于 UALink 200 v1.0 規(guī)范的協(xié)議棧高層概述:
UALink 事務(wù)層 / 數(shù)據(jù)鏈路層特性與設(shè)計(jì)目標(biāo)
固定有效載荷(64 字節(jié) / 640 字節(jié))、虛擬通道、鏈路層重傳(LLR)、基于信用量的流控
加速器核心、安全防護(hù)
統(tǒng)一地址排序、低延遲運(yùn)行設(shè)計(jì)、線纜長(zhǎng)度<4 米、請(qǐng)求 - 響應(yīng)往返時(shí)延<1 微秒、支持 1-4 個(gè)機(jī)柜、終端節(jié)點(diǎn)≤1000 個(gè)
UALink 各層核心屬性
事務(wù)層 / 協(xié)議層:UALink 專屬設(shè)計(jì)
鏈路層支持:多源 - 目的對(duì)的請(qǐng)求與響應(yīng)可打包傳輸、端到端加密與身份認(rèn)證
數(shù)據(jù)鏈路層:UALink 專屬設(shè)計(jì)
應(yīng)用層:操作系統(tǒng) / 驅(qū)動(dòng) / 類庫(kù)
鏈路控制層:UALink 邏輯鏈路控制、鏈路層重試
UALinkSec 安全組件部署在事務(wù)層與協(xié)議層之間,雖僅被描述為實(shí)現(xiàn) “端到端加密與身份認(rèn)證”,看似輕量,但其核心作用是保護(hù)網(wǎng)絡(luò)流量與交換機(jī)免受各類攻擊,無論攻擊者是物理接入還是遠(yuǎn)程入侵。UALinkSec 支持對(duì) UALink 協(xié)議的所有信道(請(qǐng)求信道、讀響應(yīng)信道、寫響應(yīng)信道)進(jìn)行加密和身份認(rèn)證,啟用后可同時(shí)保障數(shù)據(jù)的機(jī)密性與完整性。下圖為標(biāo)注了 UALinkSec 工作環(huán)節(jié)的簡(jiǎn)化架構(gòu)圖:

(加速器 X 功能 / 協(xié)議層)——(UALinkSec 安全組件)——(加速器 Y 功能 / 協(xié)議層)

采用 AES-GCM 加密算法,兼顧安全與傳輸速度
UALinkSec 與 UALink 的其他網(wǎng)絡(luò)層實(shí)現(xiàn)了清晰的解耦,這使其非常適合通過專用硬件協(xié)處理器模塊來實(shí)現(xiàn)。但加密算法的運(yùn)算本身屬于高負(fù)載任務(wù),而 AI 數(shù)據(jù)中心的能效問題正日益受到關(guān)注,尤其是能效消耗會(huì)隨 AI 節(jié)點(diǎn)數(shù)量的增加而同步攀升。在加密運(yùn)算的設(shè)計(jì)中,運(yùn)算耗時(shí)和功耗是核心考量指標(biāo),而能否做好這一點(diǎn),關(guān)鍵只在一個(gè)簡(jiǎn)單的決策:選擇合適的加密算法。若算法本身具備高效性,那么圍繞其搭建運(yùn)算架構(gòu)、以更低功耗實(shí)現(xiàn)加密數(shù)據(jù)的線速傳輸,就會(huì)成為一項(xiàng)更易實(shí)現(xiàn)的任務(wù)。
在制定全新的安全規(guī)范時(shí),研發(fā)者可選擇一款兼具安全性與高速性的現(xiàn)代加密算法,而 UALinkSec 最終選定了 AES-GCM 算法。該算法是高級(jí)加密標(biāo)準(zhǔn)(AES)的衍生版本,基于伽羅華 / 計(jì)數(shù)器模式實(shí)現(xiàn),是一款超高速的對(duì)稱密鑰分組密碼算法,通過低成本的專用硬件即可充分釋放其高速運(yùn)算的潛力。
基于上述設(shè)計(jì)背景,新思科技研發(fā)了全新的 IP 模塊 ——UALinkSec_200 安全模塊,作為 UALink 控制器 IP 和 224G PHY IP 的配套產(chǎn)品,共同構(gòu)成一套完整的 UALink IP 解決方案。該安全模塊完全符合 UALink 200 規(guī)范中關(guān)于 UALinkSec 組件的各項(xiàng)要求,除核心的加解密功能外,還支持密鑰派生功能和可選的身份認(rèn)證功能,且所有功能均可在 UALink 單通道 200 吉比特 / 秒的全速下運(yùn)行。模塊的結(jié)構(gòu)框圖清晰展示了其對(duì)發(fā)送和接收兩條數(shù)據(jù)通路的處理邏輯:

(UALinkSec 200 安全模塊結(jié)構(gòu)框圖)






評(píng)論