全球首款真正的RISC-V架構(gòu)人工智能筆記本電腦
2 月 27 日在波士頓舉辦的一場技術(shù)研討會上,發(fā)生了一件看似細微卻意義重大的事:開發(fā)者們坐在一臺 RISC-V 架構(gòu)筆記本電腦前,成功安裝了 Fedora 系統(tǒng),并運行了本地大語言模型。全程無仿真模擬,無外接顯示器的開發(fā)板,就是一臺真正的筆記本電腦。

十多年來,RISC-V 架構(gòu)的擁護者一直承諾,這一開源指令集終將走進主流計算設(shè)備。但在此之前,其實際應(yīng)用大多局限于評估板、嵌入式系統(tǒng)和科研平臺,而ROMA II 筆記本電腦徹底改變了這一現(xiàn)狀。開發(fā)者可將其當(dāng)作普通電腦使用 —— 開機、安裝 Linux 系統(tǒng)、運行軟件、開展人工智能相關(guān)測試。這場隸屬于 RISC-V 全球日活動、由深度計算公司、紅帽公司與 RISC-V 國際協(xié)會聯(lián)合贊助的波士頓研討會,與其說是一場產(chǎn)品發(fā)布會,不如說是一次技術(shù)實測。參會者直接上手操作硬件、調(diào)試操作系統(tǒng),并對設(shè)備進行極限測試,以此摸清其功能亮點與現(xiàn)存短板。在任何技術(shù)生態(tài)中,當(dāng)開發(fā)者開始能對平臺進行極限測試、發(fā)現(xiàn)其問題時,這個平臺才算真正走向成熟。
這款筆記本電腦基于玄鐵 K1 芯片打造,該芯片是一款面向邊緣人工智能和通用計算的 RISC-V 架構(gòu)片上系統(tǒng)。其研發(fā)初衷并非與蘋果 M 系列芯片或高通新一代人工智能電腦處理器展開競爭,二者的定位截然不同。這是一款基于開源指令集的開發(fā)者專用設(shè)備,旨在探索以 RISC-V 架構(gòu)為核心的人工智能筆記本電腦的實際形態(tài)。該芯片架構(gòu)融合了三大計算核心模塊:一是主頻約 2GHz 的八核 64 位通用計算核心;二是搭載 256 位 RISC-V 向量擴展指令集(RVV 1.0)的向量計算引擎;三是名為人工智能融合引擎的專用神經(jīng)網(wǎng)絡(luò)處理器,其算力可達約 2 萬億次運算 / 秒。
其中,標(biāo)量計算核心負責(zé)運行操作系統(tǒng)和處理應(yīng)用邏輯;向量計算引擎承接人工智能工作負載中各類復(fù)雜的中間處理環(huán)節(jié),包括量化、反量化、歸一化及數(shù)據(jù)重塑;而神經(jīng)網(wǎng)絡(luò)處理器則專門加速 Transformer 模型推理過程中占比極高的稠密矩陣乘法運算。不熟悉 RISC-V 向量擴展指令集的讀者,可在 GitHub 上參考唐川博士的《RISC-V 向量擴展入門指南》(網(wǎng)址:https://github.com/simplex-micro/riscv-vector-primer)。該設(shè)備搭載最高 16GB 的 LPDDR4X 內(nèi)存,搭配 NVMe 固態(tài)硬盤,整體采用兼容 Framework 標(biāo)準(zhǔn)的模塊化機身設(shè)計,定位十分明確 —— 就是一款開發(fā)者專用筆記本電腦。
本次波士頓研討會將操作重心放在 Fedora Linux 系統(tǒng)上,這一選擇經(jīng)過了深思熟慮。紅帽公司早已暗中將 RISC-V 架構(gòu)列為重點上游架構(gòu)研發(fā)目標(biāo),而本次研討會則直觀展現(xiàn)了這一研發(fā)工作的推進成果。參會者在 ROMA II 硬件上成功啟動 Fedora 系統(tǒng),檢測了內(nèi)核支持情況、軟件包覆蓋范圍,并梳理出了仍需完善的技術(shù)空白。這是主流 Linux 發(fā)行版首次在公開的開發(fā)者研討會上,在 RISC-V 架構(gòu)筆記本電腦上實現(xiàn)交互式運行。放在幾年前,單是這一點就足以成為行業(yè)焦點,而后續(xù)的技術(shù)演示則更具里程碑意義。
研討會的演示環(huán)節(jié)很快從操作系統(tǒng)切換至人工智能領(lǐng)域:開發(fā)者成功加載了參數(shù)量約 10 億至 30 億的輕量級語言模型,并實現(xiàn)了本地推理,Token 生成全程實時可見,還可靈活調(diào)整量化參數(shù),設(shè)備的熱功耗表現(xiàn)也清晰可測。此次演示的目的,并非證明 RISC-V 架構(gòu)能與 GPU 服務(wù)器匹敵,而是用更簡單的方式驗證:該平臺可切實實現(xiàn)本地人工智能推理。測試過程中,幾個技術(shù)特點立刻顯現(xiàn):神經(jīng)網(wǎng)絡(luò)處理器是實現(xiàn)本地推理的核心,一旦模型參數(shù)量超出基礎(chǔ)水平,純 CPU 推理的速度會大幅下降;向量計算引擎則默默承擔(dān)了大量周邊處理工作,包括量化、鍵值緩存更新、歸一化和數(shù)據(jù)重塑,而這些正是現(xiàn)代人工智能系統(tǒng)不可或缺的銜接性邏輯運算。整套執(zhí)行模式并不陌生:由 CPU 統(tǒng)籌調(diào)度,神經(jīng)網(wǎng)絡(luò)處理器負責(zé)高強度數(shù)學(xué)運算,向量計算單元則處理二者之間的數(shù)據(jù)轉(zhuǎn)換工作。
測試發(fā)現(xiàn),設(shè)備的核心性能瓶頸在于內(nèi)存帶寬。當(dāng)模型參數(shù)量接近 30 億時,LPDDR4X 內(nèi)存的吞吐能力便會受限,這也是深度計算公司將 ROMA II 定位為開發(fā)者平臺,而非消費級人工智能筆記本電腦的原因之一。即便如此,該系統(tǒng)在持續(xù)高負載運行下仍表現(xiàn)穩(wěn)定:開發(fā)者進行了長時間的推理測試,設(shè)備僅出現(xiàn)可預(yù)測的熱節(jié)流降頻現(xiàn)象,內(nèi)核驅(qū)動全程穩(wěn)定,未發(fā)生任何崩潰或卡死情況。對于第一代 RISC-V 架構(gòu)筆記本電腦平臺而言,這樣的穩(wěn)定性遠比跑分?jǐn)?shù)據(jù)更重要。
這款設(shè)備的落地,已然實現(xiàn)了 RISC-V 生態(tài)多年來的多個期待:可原生運行 Fedora 系統(tǒng)、能本地執(zhí)行真實的大語言模型工作負載、且完全基于開源指令集生態(tài)運行。兼容 Framework 標(biāo)準(zhǔn)的模塊化機身,對從事內(nèi)核、驅(qū)動和機器學(xué)習(xí)軟件研發(fā)的工程師而言極具吸引力。與此同時,其短板也十分明顯:2 萬億次運算 / 秒的神經(jīng)網(wǎng)絡(luò)處理器算力僅能支撐小參數(shù)量模型,無法運行 70 億參數(shù)量的更大規(guī)模網(wǎng)絡(luò);CPU 性能與當(dāng)下主流筆記本處理器相比處于中等水平;內(nèi)存帶寬限制了算力的橫向擴展;現(xiàn)階段獨立顯卡對機器學(xué)習(xí)工作負載的助力微乎其微。簡言之,ROMA II 并非一款消費級人工智能筆記本電腦,而是為 RISC-V 生態(tài)打造的開發(fā)者工作站。
盡管如此,這場波士頓研討會仍釋放出了更深遠的行業(yè)信號。多年來,關(guān)于 RISC-V 架構(gòu)筆記本電腦的討論,大多停留在演示文稿和產(chǎn)品路線圖層面,而此次研討會上,開發(fā)者們真正在實體硬件上完成了 Linux 系統(tǒng)安裝、軟件編譯和人工智能模型運行 —— 這一轉(zhuǎn)變徹底改變了行業(yè)對該架構(gòu)的討論維度。當(dāng)工程師能將一款平臺當(dāng)作普通電腦使用,對其進行開機、修改、極限測試時,這一架構(gòu)就不再只是一個科研課題,而成為了真正的工程研發(fā)目標(biāo)。
深度計算公司的產(chǎn)品路線圖,已明確指向了下一步研發(fā)方向:即將推出的DC-ROMA 人工智能電腦,將搭載奕斯偉雙芯片架構(gòu)的片上系統(tǒng),配備八核思爾芯 P550 計算核心,神經(jīng)網(wǎng)絡(luò)處理器算力可達約 40 萬億次運算 / 秒,內(nèi)存升級為 32GB 至 64GB 的 LPDDR5,同時搭載定制化向量計算集群,且兼容 Framework 13 英寸筆記本的機身設(shè)計。這一算力水平,足以輕松支撐 40 億至 70 億參數(shù)量的人工智能模型。從這一角度來看,ROMA II 并非 RISC-V 架構(gòu)人工智能筆記本的終點,而是通往更成熟產(chǎn)品的橋梁。
從外界視角看,波士頓這場研討會的成果似乎微不足道 —— 不過是一屋子開發(fā)者在電腦上安裝 Linux 系統(tǒng)、運行語言模型。但技術(shù)生態(tài)的變革,往往就源于這樣的時刻:筆記本成功開機、軟件順利運行、開發(fā)者開始展開各類實驗。從這一刻起,RISC-V 架構(gòu)不再是紙上談兵的構(gòu)想,而讓基于該架構(gòu)的個人計算設(shè)備真正照進了現(xiàn)實。











評論