deepseek-v4 文章 最新資訊
中國AI史上最大融資:DeepSeek背后的野心與變局
- DeepSeek正進行首輪融資,金額高達500億元人民幣,其中創(chuàng)始人梁文鋒個人或出資200億。若順利完成將刷新中國AI公司融資紀錄,其估值也將飆升至515億美元,重塑全球大模型產(chǎn)業(yè)格局。更值得關(guān)注的是,DeepSeek V4.1或于6月登場,主打MCP協(xié)議適配與多模態(tài)能力。而大洋彼岸OpenAI發(fā)布GPT-5.5系列的同時,Anthropic年化收入已突破440億美元。在多模態(tài)理解、長程智能體、商業(yè)營收等維度上,DeepSeek與頂尖對手仍存在差距。這筆融資將如何縮短追趕距離,又將把中國AI引向何方?商業(yè)
- 關(guān)鍵字: AI DeepSeek OpenAI Anthropic 大語言模型
摩爾線程完成DeepSeek-V4全鏈路工程化適配:S5000基于MUSA+SGLang實現(xiàn)復雜MoE模型快速落地
- 近日,摩爾線程依托旗艦級AI訓推一體智算卡MTT S5000與自研MUSA軟件棧,基于SGLang 開源推理框架,成功完成DeepSeek-V4的完整運行驗證。該成果表明,面向新一代MoE大模型,摩爾線程已構(gòu)建起從硬件架構(gòu)核心計算引擎承接、熱點算子支持,再到端到端部署驗證的系統(tǒng)化適配鏈路,驗證了國產(chǎn)GPU平臺對前沿大模型“框架級兼容、開箱即落地”的承載實力及工程化落地能力。隨著大模型架構(gòu)持續(xù)演進,DeepSeek-V4等先進模型對底層精度能力、算子覆蓋、編譯優(yōu)化、并行通信和推理效率提出了嚴苛要求。摩爾線程
- 關(guān)鍵字: 摩爾線程 DeepSeek-V4 全鏈路工程化
摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4
- 4月24日,摩爾線程攜手智源眾智FlagOS社區(qū),在旗艦級AI訓推一體全功能GPU MTT S5000上,率先實現(xiàn)對新一代大模型DeepSeek-V4-Flash的Day-0極速適配,并完成了全量核心算子的深度優(yōu)化與部署支持。DeepSeek-V4-Flash 采用混合專家(MoE)架構(gòu),總參數(shù)量高達284B,激活參數(shù)13B,支持百萬token上下文長度。其預訓練數(shù)據(jù)超32Ttoken,在最大推理力度模式(Flash-Max)下推理能力逼近Pro版本。值得關(guān)注的是,V4模型首次采用“FP4+FP8”混合精
- 關(guān)鍵字: 摩爾線程 S5000 智源 FlagOS FP8引擎 DeepSeek-V4
特斯拉中國車機牽手豆包、DeepSeek
- 據(jù)網(wǎng)信上海消息,特斯拉車機語音大模型服務(wù)于4月20日完成備案。這也是自2013年進入中國市場以來,特斯拉車機語音助手的一次大更新。備受關(guān)注的特斯拉中國車機語音大模型服務(wù)終于塵埃落定。據(jù)科創(chuàng)板日報從知情人士處獲悉,特斯拉車機語音服務(wù)將接入豆包大模型。按照相關(guān)規(guī)定,已上線的生成式人工智能應用應在顯著位置或產(chǎn)品詳情頁面公示所使用已備案生成式人工智能服務(wù)情況,注明模型名稱及備案號,并根據(jù)《人工智能生成合成內(nèi)容標識辦法》添加生成合成內(nèi)容標識。事實上,早在備案消息公布之前,特斯拉中國官網(wǎng)的《特斯拉車機語音助手使用條款
- 關(guān)鍵字: 特斯拉 豆包 DeepSeek
DeepSeek V4發(fā)布前奏?已適配華為AI芯片
- 4月8日凌晨,DeepSeek迎來重要更新,在最新版本中DeepSeek輸入框上方新增“快速模式”與“專家模式”。系統(tǒng)提示:快速模式適合日常對話,即時響應;專家模式擅長復雜問題,高峰需等待。不過,目前新版本還處于灰度測試中,并不是全量版本,可以在對話框里輸入“專家模式”,就會自動啟用新版本。當然,將用戶自然分流至兩個入口,這本身也是一種算力調(diào)度策略,有助于實現(xiàn)限額限流、緩解峰值壓力。根據(jù)當前測試與網(wǎng)友分析:快速模式背后可能調(diào)用了一個更輕量的V4 Lite模型;專家模式則疑似路由至更大、更強的模型,有猜測認
- 關(guān)鍵字: DeepSeek 華為 AI 芯片
再決勝負?中國AI人才正在改寫全球版圖
- 《經(jīng)濟學人(The Economist)》近日發(fā)表題為“中國正贏得人工智能人才競賽(China is winning the AI talent race”的文章。指出,過去十年,盡管美國在AI人才爭奪戰(zhàn)上保持領(lǐng)先,但在關(guān)鍵的AI“頂尖人才”維度上,中國正迅速超越美國。去年底,英偉達掌門人黃仁勛在一場關(guān)于人工智能的問答活動中,問了自己一個問題:“美國有沒有可能在人工智能上落后于我們國家?”他的回答也很直接:“絕對有可能?!边@似乎有些令人驚訝,因為過去十年大部分時間里,美國在AI競賽中一直處于相對領(lǐng)先的位置
- 關(guān)鍵字: AI 制造業(yè) DeepSeek 姚班
日本最強AI被曝套殼DeepSeek
- 3月17日,日本互聯(lián)網(wǎng)巨頭樂天集團發(fā)布大模型Rakuten AI 3.0,并將其定義為在日本經(jīng)濟產(chǎn)業(yè)省與新能源產(chǎn)業(yè)技術(shù)綜合開發(fā)機構(gòu)(NEDO)推動的GENIAC項目框架下開發(fā)的“日本國內(nèi)最大規(guī)模高性能AI模型”。然后發(fā)布當天,這款日本最強大模型就“翻車”了。截至目前,樂天集團沒有任何公開回應。根據(jù)樂天的官方新聞稿,Rakuten AI 3.0是"基于開源社區(qū)最優(yōu)秀的模型,結(jié)合樂天獨自的高品質(zhì)雙語數(shù)據(jù)、技術(shù)力和研究成果開發(fā)"的,對Deepseek只字未提。不過,模型上線后不久,技術(shù)社區(qū)很
- 關(guān)鍵字: AI DeepSeek Rakuten
深度求索上下文窗口擴大十倍,智譜同步發(fā)布新模型,中國AI競賽加速
- 中國的AI大模型競賽正在加速升溫。據(jù)《南華早報》報道,中國AI初創(chuàng)公司深度求索(DeepSeek)已對其旗艦模型進行重大升級,顯著擴展了上下文窗口并更新了知識庫,引發(fā)市場對其下一代重磅模型發(fā)布的高度期待。報道稱,此次升級將模型的上下文窗口從12.8萬token大幅擴展至超過100萬token——接近十倍的增長,有望顯著增強其處理和回應復雜提示的能力。同時,模型的知識截止時間也從2024年7月延長至2025年5月,新增近一年的信息,使用戶能夠獲取更近期的數(shù)據(jù)。不過,據(jù)鳳凰網(wǎng)科技指出,此次升級并未引入多模態(tài)視
- 關(guān)鍵字: deepseek AI
深度求索有望獲準采購英偉達H200芯片,中國 reportedly 給出有條件放行信號
- 路透社報道,在市場傳聞深度求索(DeepSeek)計劃于農(nóng)歷新年假期期間發(fā)布其下一代AI大模型之際,中國已向這家頭部初創(chuàng)公司發(fā)出有條件批準,允許其采購英偉達(NVIDIA)的H200 AI芯片,但具體監(jiān)管條款仍在最終敲定中。深度求索可能并非唯一獲準的企業(yè)。路透社此前曾報道,包括字節(jié)跳動、阿里巴巴和騰訊在內(nèi)的其他中國科技巨頭也已獲得授權(quán),合計可采購超過40萬顆H200芯片。報道稱,中國工業(yè)和信息化主管部門已對這四家公司發(fā)放了采購許可,但均附帶條件,相關(guān)細則尚在完善。據(jù)一位消息人士透露,這些具體條款正由中國的
- 關(guān)鍵字: Deepseek 英偉達 H200
字節(jié)跳動、阿里、深度求索據(jù)傳將于2月集中發(fā)布新模型,助推中國AI競賽白熱化
- 據(jù)傳,中國多家科技公司計劃在2026年農(nóng)歷新年假期期間(2月)密集推出新一代人工智能大模型。根據(jù)自媒體“ijiwei”報道,消息人士透露,字節(jié)跳動和阿里巴巴正籌備在此期間發(fā)布全新旗艦AI模型。此前,《EE Times China》曾指出,深度求索(DeepSeek)近期在其GitHub代碼庫中更新了名為“MODEL1”的新架構(gòu)標識,被廣泛視為其下一代旗艦模型 DeepSeek V4 的技術(shù)基礎(chǔ)。有消息稱,該模型最早可能于2026年2月中旬發(fā)布,將進一步加劇行業(yè)競爭。字節(jié)跳動加碼AI:三
- 關(guān)鍵字: 字節(jié)跳動 阿里 Deepseek
周年回顧|DeepSeek如何改變開源AI
- 在DeepSeek R1發(fā)布一周年之際,讓我們一起來回顧DeepSeek究竟是如何改變了開源AI —— R1并不是當時最強的模型,真正意義而在于它如何降低了三重壁壘。i. 技術(shù)壁壘:通過公開分享其推理路徑和后訓練方法,R1將曾經(jīng)封閉在API背后的高級推理能力,轉(zhuǎn)變?yōu)榭上螺d、可蒸餾、可微調(diào)的工程資產(chǎn),推理開始表現(xiàn)得像一個可復用的模塊,在不同的系統(tǒng)中反復應用。這也推動行業(yè)重新思考模型能力與計算成本之間的關(guān)系,這種轉(zhuǎn)變在中國這樣算力受限的環(huán)境中尤為有意義。ii. 采用壁壘:R1以MIT許可證發(fā)布,使其使用、修改
- 關(guān)鍵字: DeepSeek 開源 AI
DeepSeek新模型曝光:MODEL1代碼預示新架構(gòu),最快有望2月發(fā)布
- 1 月 21 日消息,The Information 月初爆料稱,DeepSeek 將在今年 2 月中旬農(nóng)歷新年期間推出新一代旗艦 AI 模型 ——DeepSeek V4,將具備更強的寫代碼能力。1 月 20 日,正值 DeepSeek-R1 發(fā)布一周年之際,有開發(fā)者發(fā)現(xiàn) DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代碼,橫跨 114 個文件中有 28 處都提到了未知的“MODEL1”大模型標識符。該標識符與已知的現(xiàn)有模型“V32”(即 DeepSeek-V3.2)被并列或區(qū)別提
- 關(guān)鍵字: DeepSeek MODEL1 代碼 新架構(gòu) DeepSeek V4
中國開源AI模型下載量首超美國,DeepSeek再出手
- 近日,一份來自麻省理工學院(MIT)與開源社區(qū)Hugging Face的聯(lián)合報告顯示:在剛剛過去的一年里,中國研發(fā)的開源人工智能模型在全球下載量中的占比達到了17.1%,歷史上首次超越了美國的15.8%。圖(來源:Financial Times) | 每周開發(fā)者下載份額,紅色及粉色區(qū)域為中國AI模型這項研究表明,在開放模型這一關(guān)鍵領(lǐng)域,中國企業(yè)正以其開源策略對美國公司過去主要依賴閉源模型所建立的競爭優(yōu)勢,已經(jīng)構(gòu)成了不可忽視的挑戰(zhàn)。DeepSeek和阿里巴巴的Qwen等中國模型,正憑借其獨特的開發(fā)與推廣模式
- 關(guān)鍵字: 開源 AI 大模型 DeepSeek
趁硅谷過節(jié)“開大”!DeepSeek上線“奧數(shù)金牌”模型!填平谷歌OpenAI護城河
- 專挑節(jié)假日搞大新聞”的DeepSeek又出手了。就在大洋彼岸的工程師們準備切火雞慶祝節(jié)日時,DeepSeek保持了極客傳統(tǒng),悄然上線了DeepSeekMath-V2。開源權(quán)重、IMO金牌水平、超越GPT-5。 這套熟悉的“三連擊”,再次鞏固了DeepSeek作為“開源燈塔”的地位。 在算力受限的背景下,DeepSeek 再次證明了自己:不需要龐大的 GPU 集群,也能用算法奇跡在最硬核的數(shù)學賽道上,教閉源巨頭們“做人”。它“不搞虛的”,直接拿數(shù)學競賽界的“終極試金石”,包括2025國際
- 關(guān)鍵字: 硅谷過節(jié) DeepSeek 奧數(shù)金牌 谷歌 OpenAI
deepseek-v4介紹
您好,目前還沒有人創(chuàng)建詞條deepseek-v4!
歡迎您創(chuàng)建該詞條,闡述對deepseek-v4的理解,并與今后在此搜索deepseek-v4的朋友們分享。 創(chuàng)建詞條
歡迎您創(chuàng)建該詞條,闡述對deepseek-v4的理解,并與今后在此搜索deepseek-v4的朋友們分享。 創(chuàng)建詞條
關(guān)于我們 -
廣告服務(wù) -
企業(yè)會員服務(wù) -
網(wǎng)站地圖 -
聯(lián)系我們 -
征稿 -
友情鏈接 -
手機EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國際技術(shù)信息咨詢有限公司
京ICP備12027778號-2 北京市公安局備案:1101082052 京公網(wǎng)安備11010802012473
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國際技術(shù)信息咨詢有限公司

