狠狠做深爱婷婷久久一区,欧美日韩国内,久久麻豆精品传媒,久久久一区一区二区,色鬼伦理片,99视频精品久久,久久精品国产久久久久久,久久久伦理电影一区二,磁力天堂河北彩花

新聞中心

EEPW首頁 > 智能計算 > 設(shè)計應(yīng)用 > 安謀科技發(fā)布“周易”X3 NPU IP,打造端側(cè)AI計算效率新標(biāo)桿

安謀科技發(fā)布“周易”X3 NPU IP,打造端側(cè)AI計算效率新標(biāo)桿

作者: 時間:2025-12-24 來源: 收藏

一、產(chǎn)品概述

2025年11月13日,(中國)有限公司(以下簡稱“”)在上海舉行新品發(fā)布會,正式推出新一代NPU IP——“周易”X3,該產(chǎn)品采用專為大模型而生的最新DSP+DSA架構(gòu),兼顧CNN與Transformer,協(xié)同完善易用的“周易”NPU Compass AI軟件平臺,致力于為基礎(chǔ)設(shè)施、智能汽車、移動終端、智能物聯(lián)網(wǎng)四大領(lǐng)域提供AI計算核芯,打造端側(cè)新標(biāo)桿,加快邊緣及端側(cè)AI規(guī)?;渴?。

二、性能躍遷

“周易”X3基于專為大模型而生的最新DSP+DSA架構(gòu),從定點轉(zhuǎn)向浮點計算,單Cluster擁有8-80 FP8 TFLOPS算力且可靈活配置,單Core帶寬高達(dá)256GB/s,相較于上一代產(chǎn)品,“周易”X3的CNN模型性能提升30%~50%,多核算力線性度達(dá)到70%~80%,在同算力規(guī)格下,AIGC大模型能力實現(xiàn)10倍增長。實測大模型性能方面,“周易”X3 在Prefill階段算力利用率達(dá)72%,Decode階段有效帶寬利用率超100%,充分釋放硬件算力潛力。

NPU產(chǎn)品線負(fù)責(zé)人兼首席架構(gòu)師舒浩博士闡釋了“周易”X3背后的技術(shù)內(nèi)核、架構(gòu)設(shè)計理念與未來演進(jìn)方向。他認(rèn)為:“‘周易’X3的產(chǎn)品優(yōu)勢,源于通用、靈活、高效且軟硬協(xié)同的系統(tǒng)架構(gòu)設(shè)計,這一設(shè)計使其兼具廣泛的行業(yè)適用性與靈活的邊端側(cè)AI應(yīng)用場景匹配能力?!?“周易”X3的計算架構(gòu)具備四大核心亮點:

1. 通用與專用融合(DSP+DSA),通過靈活可配置的架構(gòu)特性提升各場景下的計算效率;

2. 靈活可擴展,采用多核架構(gòu)與層次化內(nèi)存互連,支持靈活裁剪與擴展,適配多樣化端側(cè)AI場景;

3. 軟硬協(xié)同的任務(wù)調(diào)度,通過軟硬結(jié)合、層次化調(diào)度與資源管理架構(gòu),實現(xiàn)系統(tǒng)在多任務(wù)并行情況下對任務(wù)執(zhí)行延遲與響應(yīng)時間的差異化要求,滿足未來端側(cè)AI與AI智能體的需求;

4. 開放生態(tài)支持,提供硬件自定義接口、軟件自定義算子,開放Model Zoo與工具鏈等,與客戶協(xié)同共建“周易“X3軟件生態(tài)。

舒浩博士也公布了“周易”NPU IP架構(gòu)未來演進(jìn)的六大方向,包括計算架構(gòu)、數(shù)據(jù)格式、通用計算能力、生態(tài)合作、軟件界面與計算擴展能力等。安謀科技將緊跟AI和大模型未來趨勢,前瞻布局,不斷創(chuàng)新。

1766560575725273.png

此外,“周易”X3在架構(gòu)層面實現(xiàn)了多項創(chuàng)新,集成以下關(guān)鍵特性:

集成自研解壓硬件WDC:使大模型Weight軟件無損壓縮后通過硬件解壓能獲得額外15%~20%等效帶寬提升。

新增端側(cè)大模型運行必備的W4A8/W4A16計算加速模式:對模型權(quán)重進(jìn)行低比特量化,大幅降低帶寬消耗,支持云端大模型向端側(cè)的高效遷移。

集成AI專屬硬件引擎AIFF(AI Fixed-Function)與專用硬化調(diào)度器:實現(xiàn)超低至5%的CPU負(fù)載與低調(diào)度延遲,靈活支持端側(cè)多任務(wù)場景和任意優(yōu)先級調(diào)度場景,確保高優(yōu)先級任務(wù)的即時響應(yīng)。

支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度融合計算,強浮點計算:可靈活適配智能手機邊緣部署、AI PC推理、智能汽車等從傳統(tǒng)CNN到前沿大模型的數(shù)據(jù)類型需求,平衡性能與能效。

硬件架構(gòu):專為大模型設(shè)計最新DSP+DSA架構(gòu)

“周易”X3基于專為大模型設(shè)計的最新DSP+DSA架構(gòu),從定點轉(zhuǎn)向浮點計算,單Cluster擁有8-80 FP8 TFLOPS算力且可靈活配置,單Core帶寬高達(dá)256GB/s,支持端側(cè)大模型運行必備的W4A8/W4A16計算加速模式,集成安謀科技自研的解壓硬件WDC,使大模型Weight軟件無損壓縮后通過硬件解壓獲得額外約15%的等效帶寬,計算效率和計算密度大幅提升。

同時,“周易”X3集成AI專屬硬件引擎AIFF,配合專用硬化調(diào)度器,實現(xiàn)超低至0.5%的CPU負(fù)載與低調(diào)度延遲,使NPU在并行處理多項AI任務(wù)時,擁有高效流暢的體驗。

軟件生態(tài):優(yōu)化大模型端到端性能,支持客戶自定義AI開發(fā)

“周易”X3 搭載完善易用的Compass AI軟件平臺,全面優(yōu)化大模型端到端性能。平臺廣泛兼容TensorFlow、ONNX、PyTorch等主流AI框架,具備業(yè)界領(lǐng)先的大模型動態(tài)Shape支持能力,并支持GPTQ等大模型主流量化方案、 Hugging Face模型庫,與LLM、VLM、VLA及MoE等模型。

1766560667702362.png

                                                “周易”NPU Compass AI軟件平臺

同時,安謀科技積極構(gòu)建開放生態(tài),Compass AI軟件平臺已將 Parser、Optimizer、Linux Driver、TVM 及內(nèi)部 IR 格式等核心組件相繼開源,并擁有豐富的調(diào)試工具,可滿足開發(fā)者白盒部署需求,且支持更易用的 DSL 算子編程語言,在深度開發(fā)模式下,客戶可以使用平臺中的Compiler、Debugger和DSL語言開發(fā)出自己的自定義算子,也可通過Parser、Optimizer等工具打造出屬于自己的模型編譯器,極大提升開發(fā)效率。發(fā)布初期,“周易”Compass AI軟件平臺已支持超 160 種算子與 270 多種模型,顯著提升開發(fā)部署效率,助力客戶快速實現(xiàn) AI 應(yīng)用創(chuàng)新與落地。

軟硬深度協(xié)同下,“周易”X3的性能顯著提升, CNN模型性能較上一代提升30%-50%,在同算力規(guī)格下,AIGC大模型能力提升10倍,這得益于16倍的FP16 TFLOPS、4倍的計算核心帶寬,以及超10倍的Softmax和LayerNorm性能提升共同驅(qū)動。實測多核算力線性度達(dá)到70%-80%。實測大模型性能方面,“周易”X3 在Prefill階段算力利用率達(dá)72%,Decode階段有效帶寬利用率在開啟WDC情況下超100%,充分釋放硬件算力潛力。

安謀科技自研IP矩陣,全面助力端側(cè)AI規(guī)?;渴?/strong>

1766560730382788.png

鮑敏祺表示,安謀科技已構(gòu)建起全面且協(xié)同的自研IP產(chǎn)品矩陣,涵蓋“周易NPU”、“星辰”CPU、“山?!盨PU及“玲瓏”多媒體系列,可為合作伙伴提供高質(zhì)量、定制化的端側(cè)AI解決方案。其中,最新推出的“星辰”STAR-MC3作為面向AIoT的高能效嵌入式芯片IP,將Arm? Helium?技術(shù)擴展到傳統(tǒng)MCU架構(gòu),顯著提升了CPU在AI計算方面的性能,可助力客戶更高效地實現(xiàn)端側(cè)AI應(yīng)用的規(guī)?;渴稹?/p>

面向未來,“AI+”浪潮將重塑千行百業(yè)。安謀科技將深耕底層技術(shù),通過自研IP與先進(jìn)Arm技術(shù)的深度融合,持續(xù)筑牢AI算力根基,為客戶提供符合全球標(biāo)準(zhǔn)且精準(zhǔn)適配本土需求的解決方案,助力端側(cè)AI產(chǎn)業(yè)實現(xiàn)跨越式發(fā)展。

三、應(yīng)用場景

覆蓋基礎(chǔ)設(shè)施、智能汽車、移動終端、智能物聯(lián)網(wǎng)四大領(lǐng)域

在應(yīng)用場景上,“周易”X3可廣泛應(yīng)用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機、智能網(wǎng)關(guān)、智能IPC等AI設(shè)備,深度賦能四大核心領(lǐng)域,提升,優(yōu)化AI應(yīng)用體驗。

基礎(chǔ)設(shè)施:在加速卡場景中,支持CNN與大模型等多樣結(jié)構(gòu)的AI模型加速;

智能汽車:在ADAS系統(tǒng)中,可基于AI算力進(jìn)行為自動泊車等輔助駕駛提供AI算力支持;在IVI系統(tǒng)中,支持基于語音與車內(nèi)外視頻圖像輸入的智能互動;

移動終端:在AI PC、AI手機上,可實現(xiàn)超分渲染,提升分辨率,并支持基于大模型的AI Agent應(yīng)用;

智能物聯(lián)網(wǎng):在智能網(wǎng)關(guān)、智能IPC等設(shè)備中,提供本地AI推理能力,提升響應(yīng)速度,優(yōu)化智能體驗。

“周易”Z1:算力32~3.75 TOPS,賦能AIoT場景,廣泛支持人臉識別、人臉及人體關(guān)鍵點檢測和文字識別等,且已進(jìn)入AI智能音箱等多種產(chǎn)品。

“周易”Z2/Z3:算力25~5 TOPS,面向AIoT、入門級座艙等市場,支持前視輔助駕駛方案、艙泊一體方案及安全儀表盤方案,以及圖像超分辨率優(yōu)化等。

“周易”X1:算力10 TOPS,面向高端AIoT、汽車座艙等市場,支持駕駛員監(jiān)控、乘客監(jiān)控、自動泊車、AVM 360環(huán)視,以及AI圖像降噪等。

“周易”X2:算力10-30 TOPS,面向高端AIoT、AI PC、AI Pad、手機等市場,現(xiàn)場展示了運行Stable Diffusion v1.5的文生圖能力,運行CLIP的文搜圖能力,可實現(xiàn)端側(cè)多模態(tài)AI流暢運行。

“周易”X3:算力8-80 FP8 TFLOPS,面向基礎(chǔ)設(shè)施、智能汽車、移動終端、AIoT等市場,現(xiàn)場展示了基于“周易”X3的主流大模型效果,包括運行DeepSeek-R1-Distill-Qwen-1.5B模型的文生文AI流暢對話,運行Stable Diffusion v1.5的文生圖效果,運行MiniCPM v2.6模型的圖片識別及圖生文多模態(tài)應(yīng)用等,均展現(xiàn)出優(yōu)異的端側(cè)大模型推理性能。

從“周易”Z1的基礎(chǔ)感知到“周易”X3的復(fù)雜認(rèn)知,這一技術(shù)演進(jìn)路徑清晰地表明,端側(cè)AI正在從單一的功能實現(xiàn),邁向融合多種模型、適應(yīng)動態(tài)場景的“全民普及”新階段。的設(shè)計充分預(yù)判端側(cè)AI的“場景深化”趨勢:以極致算力表現(xiàn)破解“多模型融合”的算力需求,以全算力類型并增強浮點運算FLOPS適配“精度動態(tài)演變”的場景差異,借助軟硬協(xié)同的生態(tài)打造端側(cè)算力底座。


評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉
无为县| 漠河县| 沙雅县| 石屏县| 东乡| 儋州市| 嘉禾县| 通辽市| 渝北区| 手游| 伊春市| 连州市| 驻马店市| 三都| 广南县| 偃师市| 林西县| 缙云县| 得荣县| 巴林右旗| 河北区| 汽车| 阿拉善左旗| 沅江市| 香港 | 德阳市| 茶陵县| 平塘县| 久治县| 富顺县| 萍乡市| 龙海市| 焉耆| 奈曼旗| 海林市| 淮北市| 铅山县| 大渡口区| 延庆县| 五家渠市| 柳林县|