DeepSeek新模型不依賴英偉達

國產晶片股集體狂歡
24/08/2025
5452
收藏
分享
國產晶片股集體狂歡

內地人工智能(AI)初創企業DeepSeek,時隔近5個月再度宣布對V3基座模型進行升級,新發布的「DeepSeek V3.1」模型,功能包括對中國製造晶片的優化,以及更快的處理速度。

DeepSeek在微信帖文中指出,V3.1模型採用UE8M0 FP8精度格式,有關格式是專為「即將發布的下一代國產晶片」而設計,但帖文並未具體說明,新的兼容功能支援哪些晶片型號或製造商。

搜索智能體測評 超越R1-0528

今次是DeepSeek近月第三次模型更新。該公司今年3月進行早期的V3增強,至5月則發布R1模型升級。據介紹,DeepSeek-V3.1對分詞器及chat template進行較大調整,與DeepSeek-V3有明顯差異;相對於其R1推理模型,V3.1的Think模式能在更短時間內給出答案。此外,通過「後訓練」(Post-Training)優化,新模型在工具使用與智能體任務中的表現有較大提升。

該公司又表示,經過思維鏈壓縮訓練後,V3.1-Think在輸出token數減少20%至50%的情況下,各項任務平均表現與公司的R1-0528持平,且在搜索智能體的多項測評中取得較大提升,超越R1-0528。目前官方App與網頁端模型已同步升級至V3.1,DeepSeek的API(應用程序擴展接口)亦同步升級,且上下文均已擴展為128K,意味着模型現時能處理更多訊息,並擁有更強記憶能力。

國產晶片類股全面上揚

中國晶片製造類股22日全面上揚,其中以寒武紀科技領漲,股價一度大漲20%,市值首次突破5,000億元(約700億美元),一年內漲幅已超三倍。在港上市的中芯國際及華虹半導體亦分別勁升10%及18%。市場普遍認為,觸發本輪行情的關鍵是人工智能公司DeepSeek宣布新推出的V3模型可與「新一代國產晶片」兼容,標誌著中國AI生態正在進入軟硬協同新階段。

紐約梅隆銀行策略專家張偉勤指出,「若DeepSeek能順利在國產晶片上運行,中國半導體需求將全面釋放,潛力極大」。他同時提到,北京當局近期禁止科技企業採購英偉達(Nvidia)H20晶片,意味官方已掌握可替代方案。

UE8M0 FP8 引爆猜想

市場熱議的另一核心,是DeepSeek在更新記錄中提到的「UE8M0 FP8」精度格式。這一概念源於國際開源硬體協作計劃OCP於2023年提出的MXFP8規範。UE8M0指的是將8個bit全分配給指數位的表示方法,能顯著擴展動態範圍並降低資訊損失。與傳統FP32相比,UE8M0每組數據可節省75%的帶寬,對記憶體受限的中國AI晶片而言尤具吸引力。分析人士解釋,這種格式不僅提升效能,也讓國產晶片在運行大型模型時的性價比大幅提高。

軟硬件協同效應

在官方未點名的情況下,市場將焦點首先聚集於寒武紀。該公司旗下MLU370-S4、思元590及690系列均支持FP8計算,長期在低精度運算優化方面領先。同樣受熱議的還有海光、沐曦、中昊芯英及摩爾線程等:海光:深算三號DCU具備FP8運算能力;沐曦:曦雲C600於今年7月發佈,已支持FP8;中昊芯英:「刹那」TPU主打FP8精度;摩爾線程:MTT S5000 GPU為少數原生支持FP8的國產GPU。

此外,華為昇騰910系列雖尚未原生支持FP8,但路線圖顯示2025年底將完成相關布局,外界普遍預期下一代910D或成焦點。

業內觀點認為,DeepSeek主動貼合國產晶片最佳性能點,等於將多家中國晶片廠商拉入統一技術生態。這種「軟硬協同」模式,被比作當年的「Wintel聯盟」,有望在AI時代構建新的護城河。由於UE8M0 FP8大幅減少對帶寬與功耗的依賴,意味相同硬體可運行更大模型,對中國晶片商而言屬重大利好。 (編輯部)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報