深度求索上下文窗口擴(kuò)大十倍,智譜同步發(fā)布新模型,中國AI競賽加速

中國的AI大模型競賽正在加速升溫。據(jù)《南華早報(bào)》報(bào)道,中國AI初創(chuàng)公司深度求索(DeepSeek)已對(duì)其旗艦?zāi)P瓦M(jìn)行重大升級(jí),顯著擴(kuò)展了上下文窗口并更新了知識(shí)庫,引發(fā)市場對(duì)其下一代重磅模型發(fā)布的高度期待。
報(bào)道稱,此次升級(jí)將模型的上下文窗口從12.8萬token大幅擴(kuò)展至超過100萬token——接近十倍的增長,有望顯著增強(qiáng)其處理和回應(yīng)復(fù)雜提示的能力。同時(shí),模型的知識(shí)截止時(shí)間也從2024年7月延長至2025年5月,新增近一年的信息,使用戶能夠獲取更近期的數(shù)據(jù)。
不過,據(jù)鳳凰網(wǎng)科技指出,此次升級(jí)并未引入多模態(tài)視覺理解能力,模型仍專注于文本和語音交互。
《南華早報(bào)》補(bǔ)充稱,此次更新正值市場對(duì)DeepSeek V4版本猜測不斷升溫之際,中國各大AI廠商正競相推出新模型。彭博社進(jìn)一步透露,阿里巴巴也預(yù)計(jì)將在未來幾周內(nèi)發(fā)布其旗艦?zāi)P蚎wen-3.5。
中國AI賽道競爭加劇
在此輪密集發(fā)布浪潮中,《南華早報(bào)》還特別提到,深度求索的升級(jí)恰逢中國另一家AI初創(chuàng)公司智譜AI(Zhipu AI)于同日推出其全新旗艦?zāi)P?。?bào)道稱,智譜AI的GLM-5在代碼生成和智能體(agentic)能力方面顯著增強(qiáng),這得益于其參數(shù)量翻倍,并采用了“深度求索稀疏注意力”(DeepSeek Sparse Attention)技術(shù)——該技術(shù)旨在兼顧性能與計(jì)算效率。
市場反響熱烈。據(jù)彭博社報(bào)道,智譜AI本周已將其GLM編程套餐價(jià)格上調(diào)30%,以應(yīng)對(duì)激增的需求。《上海證券報(bào)》指出,此前中國本土大模型廠商主要依靠價(jià)格競爭,而此次智譜的提價(jià)表明,國產(chǎn)大模型在技術(shù)實(shí)力和市場競爭力方面已取得明顯進(jìn)步。
此外,據(jù)IT之家報(bào)道,GLM-5還針對(duì)多種國產(chǎn)計(jì)算平臺(tái)進(jìn)行了深度推理兼容性優(yōu)化,包括華為昇騰(Ascend)、摩爾線程(Moore Threads)、寒武紀(jì)(Cambricon)、昆侖芯(Kunlunxin)和沐曦(MetaX)。這種廣泛的硬件適配預(yù)計(jì)將支持模型在日益多元化的國產(chǎn)計(jì)算環(huán)境中高效部署。
競爭不僅限于文本模型。彭博社還指出,字節(jié)跳動(dòng)(TikTok母公司)即將推出的視頻生成模型Seedance 2.0也廣受好評(píng)。該模型目前仍在測試階段,被定位為OpenAI Sora的競爭對(duì)手,其一系列驚艷的演示視頻已在網(wǎng)絡(luò)上廣泛傳播。












評(píng)論