我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
知情人士透露,中國人工智能公司 DeepSeek 計劃于下周發(fā)布最新一代大語(yǔ)言模型 V4,這是該公司自上一款重磅產(chǎn)品推出一年多以來(lái)的首次重大更新,被視為中國在人工智能領(lǐng)域繼續向美國競爭對手發(fā)起挑戰的重要一步。

據兩名了解內情的人士透露,DeepSeek 總部位于杭州,此次推出的 V4 將是一款具備圖像、視頻與文本生成能力的多模態(tài)模型。 多名知情人士稱(chēng),DeepSeek 已與中國本土 AI 芯片廠(chǎng)商華為和寒武紀展開(kāi)合作,對 V4 進(jìn)行定制優(yōu)化,以適配雙方最新一代芯片產(chǎn)品,從而在算力層面形成更緊密的協(xié)同。 這一動(dòng)作被視為中國科技企業(yè)加速擺脫對英偉達高端 AI 芯片依賴(lài)的又一信號,而這些芯片目前正受到美國出口管制限制,相關(guān)措施旨在遏制中國的技術(shù)崛起。
此次發(fā)布的時(shí)間點(diǎn)也頗具象征意義。DeepSeek 計劃在中國一年一度的全國“兩會(huì )”召開(kāi)前夕推出 V4,而今年“兩會(huì )”將于 3 月 4 日開(kāi)幕。 這一高規格政治會(huì )議為該公司提供了重要的曝光窗口,或將進(jìn)一步鞏固其“國家級 AI 冠軍”形象。
這是 DeepSeek 自 2025 年 1 月發(fā)布 R1 推理模型以來(lái)的首次大版本迭代。 當時(shí)公司宣稱(chēng),僅憑遠低于硅谷頭部公司使用的算力規模,就訓練出在能力上可比肩領(lǐng)先模型的系統。 這一消息一度在美國科技股市場(chǎng)引發(fā)震動(dòng),有分析人士將其形容為標志中國在人工智能領(lǐng)域快速追趕、甚至改寫(xiě)格局的“斯普特尼克時(shí)刻”。 自那以后,DeepSeek 更多推出的是漸進(jìn)式更新,而非完整新架構,這也讓包括阿里巴巴、月之暗面(Moonshot)在內的國內競爭對手在低成本、開(kāi)源中文模型市場(chǎng)上獲得了額外的成長(cháng)空間。
多名知情人士預計,DeepSeek 此次專(zhuān)門(mén)針對國產(chǎn) AI 芯片優(yōu)化 V4,將有助于提振本土芯片的市場(chǎng)需求,并加速在模型推理階段(即利用已訓練模型生成回答的過(guò)程)向華為、寒武紀等中國廠(chǎng)商轉移,降低對英偉達和 AMD 芯片的依賴(lài)。 路透社此前曾率先報道 DeepSeek 與華為、寒武紀的合作進(jìn)展。 另一名了解情況的人士則表示,DeepSeek 并未與英偉達就 V4 的優(yōu)化進(jìn)行合作。
不過(guò),在模型訓練領(lǐng)域,英偉達仍占據主導地位,尤其是在需要巨量算力支持的預訓練階段,其 GPU 仍是行業(yè)標準。 《金融時(shí)報》此前報道稱(chēng),DeepSeek 曾嘗試在華為硬件上完成這一初始訓練,但過(guò)程中遇到技術(shù)難題。 該公司去年在發(fā)布 R1 模型時(shí),同時(shí)公開(kāi)了一份詳盡的技術(shù)報告,闡述如何在英偉達芯片上更高效地訓練和運行模型,相關(guān)工程方法受到廣泛關(guān)注與贊譽(yù)。 有業(yè)內人士認為,DeepSeek 分享其構建“推理模型”的訓練方法,實(shí)際上為其他實(shí)驗室提供了可復用的工程路徑,幫助后者在有限算力條件下提升模型推理能力。
所謂“推理模型”,是指專(zhuān)門(mén)針對復雜問(wèn)題求解進(jìn)行優(yōu)化的模型范式,其核心思路是將難題拆分為多個(gè)可逐步求解的子問(wèn)題,再通過(guò)多步推理得出最終結論。 有接近 DeepSeek 計劃的人士透露,公司預計將在下周發(fā)布 V4 的同時(shí)附上一份篇幅較短的技術(shù)說(shuō)明文檔,重點(diǎn)介紹關(guān)鍵改進(jìn)點(diǎn),并在大約一個(gè)月后推出更為詳盡的技術(shù)報告,以系統性披露模型架構和訓練方法。
與此同時(shí),圍繞知識產(chǎn)權與模型“借訓”的爭議也在升溫。就在本周早些時(shí)候,美國 AI 公司 Anthropic 指控 DeepSeek 及另外兩家中國 AI 實(shí)驗室對其模型實(shí)施所謂“蒸餾攻擊”,即利用更強大模型的輸出對小型模型進(jìn)行訓練,使后者在不直接使用同等級算力資源的情況下接近前者性能。 對此,華為、DeepSeek 和寒武紀均未對置評請求作出回應。