詞元時代算力先行,摩爾線程云邊端產(chǎn)品全面亮相
5月18日,摩爾線程在北京舉辦主題為“詞元時代,萬物智能”的年度產(chǎn)品發(fā)布會。在Agentic AI驅(qū)動詞元(Token)需求呈指數(shù)級躍升的關(guān)鍵節(jié)點,萬物智能處于爆發(fā)前夜,算力的基石作用愈發(fā)關(guān)鍵。
摩爾線程在此次盛會上全方位展示了其作為智算底座的戰(zhàn)略縱深,全面展示了“云-邊-端”全棧智算矩陣:從萬卡級規(guī)模的夸娥智算集群,到自研“長江”SoC驅(qū)動的智能終端MTT AICUBE和MTT AIBOOK;從數(shù)字世界智能體“小麥”,到加速物理AI落地的首個全棧具身智能仿真平臺MT Lambda,再到持續(xù)進化的MUSA生態(tài)。這不僅是摩爾線程核心技術(shù)和產(chǎn)品的集中亮相,更標志著其全面打通了“云-邊-端”智能算力生態(tài),賦能從數(shù)字世界到物理世界的全場景AI應(yīng)用。

云端筑基:夸娥智算集群,全鏈路加速大模型訓(xùn)推
在智算基礎(chǔ)設(shè)施領(lǐng)域,摩爾線程以夸娥(KUAE)智算集群為核心,構(gòu)建起適配詞元時代需求的高性能AI基礎(chǔ)設(shè)施。目前,夸娥萬卡級智算集群已經(jīng)成功落地,多項關(guān)鍵指標達到國際主流水平,在Dense大模型訓(xùn)練中的模型算力利用率(MFU)達60%,在MoE大模型上達40%,有效訓(xùn)練時長達90%,訓(xùn)練線性擴展效率達95%。這標志著摩爾線程已具備支撐超大規(guī)模模型穩(wěn)定訓(xùn)練的硬核實力。

大模型訓(xùn)練是一項極為復(fù)雜的系統(tǒng)性工程,涵蓋預(yù)訓(xùn)練、持續(xù)預(yù)訓(xùn)練(CPT)、長文本訓(xùn)練、微調(diào)(SFT)及強化學(xué)習(xí)(RL)等流程。為賦能開發(fā)者,摩爾線程推出夸娥訓(xùn)練套件,覆蓋大模型預(yù)訓(xùn)練和后訓(xùn)練全鏈路,包括訓(xùn)練框架、AI框架及訓(xùn)練輔助工具等核心組件,專門優(yōu)化了對強化學(xué)習(xí)的支持,兼容業(yè)界主流的VeRL訓(xùn)推一體與Slime訓(xùn)推分離框架,并完成了對多項微調(diào)框架的適配。面對高達數(shù)十萬億Tokens的超大規(guī)模數(shù)據(jù)集,基于摩爾線程萬卡級集群訓(xùn)練的科學(xué)基礎(chǔ)大模型,實現(xiàn)了全流程訓(xùn)練技術(shù)的突破,在MMLU等評測指標上的表現(xiàn)持續(xù)提升。

在推理端,摩爾線程展現(xiàn)了其深厚的生態(tài)底蘊與“發(fā)布即適配”(Day-0適配)的響應(yīng)速度。目前,摩爾線程已全面適配DeepSeek、GLM、MiniMax、Kimi、Qwen等國內(nèi)頭部大模型,以及主流的語音、視覺理解及多模態(tài)模型。值得一提的是,摩爾線程在推理框架SGLang主線代碼中獲得了官方原生支持,并開源了vLLM-MUSA,可原生獲得摩爾線程GPU加速能力,大幅提升推理效率。
夸娥云服務(wù)以“算力即服務(wù)”的方式,將前沿模型推理能力快速轉(zhuǎn)化為可用的行業(yè)應(yīng)用:現(xiàn)場展示了基于GLM模型推理服務(wù)的Vibe Coding,用戶用口語描述需求即可生成專屬App,整個開發(fā)由多智能體協(xié)同完成,無需手寫代碼;同時以AIGC微短劇制作工作流,呈現(xiàn)從劇本策劃到視頻合成的全鏈路智能生成,直觀展示夸娥在內(nèi)容創(chuàng)作與智能化應(yīng)用落地上的強大生產(chǎn)力。
終端進階:“長江”SoC驅(qū)動,開啟全場景智能
發(fā)布會上,以“小麥”智能體為核心的端側(cè)AI產(chǎn)品正式亮相。基于情景感知決策、長上下文歷史檢索、自主任務(wù)編排、多模態(tài)情緒識別以及跨端協(xié)同、端云一體的能力,“小麥”可以提供有溫度的專屬人格體驗。其背后依托三大關(guān)鍵技術(shù)支撐:運行于AI原生操作系統(tǒng)MTT AIOS,采用獨特的二維拓撲記憶系統(tǒng),搭載自研Agent開源框架MTClaw。

為承載“小麥”智能體的智慧進化,摩爾線程重磅發(fā)布了全新智能家庭AI中樞——MTT AICUBE,標志著Agentic AI將走進千家萬戶。它深度整合了“智能體 + AI PC + AI NAS”三大核心能力矩陣,以一站式解決方案賦能家庭智能體驗。AICUBE內(nèi)置的“小麥”智能體預(yù)裝60余項技能(Skills),支持超36款A(yù)PP的跨應(yīng)用控制,提供智慧化的主動服務(wù);全閃存AI NAS模塊則為家庭數(shù)據(jù)提供了安全、高效的本地存儲與智能管理;同時,AICUBE還具備完整的桌面AI PC能力,可輕松滿足家庭用戶的觀影娛樂、高效辦公、在線學(xué)習(xí)、云游戲以及本地大模型運行等全方位需求。AICUBE將于6月18日在京東摩爾線程旗艦店開啟預(yù)售。
與此同時,摩爾線程宣布MTT AIBOOK全面升級。作為“為智能體而生”的筆記本電腦,AIBOOK在MTT AIOS原生Linux系統(tǒng)下,預(yù)裝原生“龍蝦”智能體(OpenClaw),支持多智能體協(xié)作,為智能體應(yīng)用的開發(fā)、調(diào)試與部署提供完整的閉環(huán)解決方案。AIBOOK具備“工具直達”特性,提供90+工具調(diào)用接口,降低開發(fā)配置成本;并創(chuàng)新支持原生Linux、虛擬化Windows及容器化Android多系統(tǒng),同時提供LLM/ASR/TTS/OCR等模型支持的“端側(cè)感知”能力,一臺設(shè)備即可覆蓋用戶的全場景使用需求。

面向端側(cè)和邊緣場景,摩爾線程以“長江”智能SoC為核心構(gòu)建多維產(chǎn)品矩陣:除AICUBE與AIBOOK外,還展示了專為嵌入式邊緣場景設(shè)計的MTT E300 AI模組,支持混合精度計算,可在嚴苛環(huán)境中穩(wěn)定運行,為工業(yè)質(zhì)檢、能源巡檢、智慧教室、具身智能、智能汽車及低空經(jīng)濟等典型場景提供高效、低延遲、強可靠的邊緣AI能力。

物理跨越:生態(tài)閉環(huán),賦能具身智能訓(xùn)練與仿真
摩爾線程重磅發(fā)布其首個全棧具身智能仿真平臺MT Lambda,旨在賦能用戶構(gòu)建數(shù)據(jù)合成、策略訓(xùn)練、仿真驗證的高效工作流。該平臺構(gòu)建了從底層算力、核心引擎到上層框架及工具的完整解決方案:其底層基于全功能GPU,實現(xiàn)渲染、物理、AI計算在同一芯片中完成,數(shù)據(jù)“零拷貝”;中間層深度融合自研物理、渲染、AI三大引擎;上層則提供MT Lambda-Lab具身策略開發(fā)與訓(xùn)練平臺以及MT Lambda-Sim高保真物理仿真與渲染平臺。在發(fā)布會現(xiàn)場,摩爾線程通過機器狗實景演示,直觀展現(xiàn)了該平臺在具身智能策略開發(fā)與動作訓(xùn)練上的卓越表現(xiàn)。

當前,具身智能加速從技術(shù)驗證邁向工程化與產(chǎn)業(yè)化,摩爾線程作為國內(nèi)極為稀缺的打通“大模型訓(xùn)練—仿真模擬—端側(cè)部署”生態(tài)閉環(huán)的GPU企業(yè),已經(jīng)構(gòu)建起全棧自主、端到端的軟硬件技術(shù)棧,可以為具身智能提供一站式、安全可靠的國產(chǎn)算力方案。
在具身智能領(lǐng)域,摩爾線程依托自研的夸娥智算集群、仿真平臺及端側(cè)SoC芯片,已經(jīng)形成云邊端協(xié)同的產(chǎn)品與能力布局。同時,摩爾線程積極拓展具身生態(tài)“朋友圈”,通過與光輪智能在合成數(shù)據(jù)等關(guān)鍵領(lǐng)域共筑國產(chǎn)具身智能仿真底座,以及與光線云聯(lián)合打造RaysTwins具身仿真平臺等深度合作,共同推動技術(shù)成果加速轉(zhuǎn)化落地。
生態(tài)進化:MUSA 100%兼容,開源與開放共建
作為貫穿摩爾線程全功能GPU硬件與全棧軟件體系的底層架構(gòu),MUSA已全面實現(xiàn)對業(yè)界主流CUDA生態(tài)的深度兼容。最新發(fā)布的MUSA SDK 5.1.0,對標CUDA 12.8,從驅(qū)動與運行時新增248個API,兼容接口數(shù)達到761,到核心數(shù)學(xué)庫的100%對齊,從覆蓋55類核心AI算子,到完整支持PyTorch全部3194個算子,MUSA軟件棧全鏈路覆蓋了底層驅(qū)動、編譯器、算子加速庫、訓(xùn)練與推理框架,讓國產(chǎn)GPU真正具備“即插即用”的開放能力。

在開源生態(tài)與關(guān)鍵場景中,MUSA也取得了里程碑式的突破:在推理生態(tài)上,MUSA不僅正式成為vLLM官方后端,更成功合入SGLang官方主線并獲得“原生支持”;在底層編譯上,TileLang-MUSA成功合入開源主線,升級支持Trition 3.6最新版本,F(xiàn)lashAttention3等熱點算子在MUSA上達到95%的極致效率;此外,訓(xùn)練套件產(chǎn)品化支撐超大規(guī)模集群與強化學(xué)習(xí),推理套件全面適配主流框架。無論是前沿大模型訓(xùn)練,還是科學(xué)計算中的VASP加速,MUSA都已交出成熟答卷。
更具前瞻性的是,MUSA正引入AI技術(shù)加速生態(tài)的自我演進。依托Automusify 智能遷移工具的“零干預(yù)”自動化轉(zhuǎn)化,MUSA實現(xiàn)了對Top 100人工智能與Top 100科學(xué)計算兩大領(lǐng)域加速倉庫的100%自動遷移。同時,全新升級的MUSACODE AI 編程助手通過大模型智能體協(xié)同,已成功開發(fā)并交付超10,000個Kernel算子,基于TileLang自動調(diào)優(yōu)Group GEMM算子實現(xiàn)60%性能提升。
MUSA不僅是國產(chǎn)GPU的生態(tài)底座,更是一個開放、自進化、與開發(fā)者共同成長的智能生態(tài)。未來已來,我們誠邀您一同加入MUSA,共創(chuàng)國產(chǎn)算力的新篇章。


評論