據內地媒體報道,華為將於8月12日在「2025金融AI推理應用落地與發展論壇」上發佈AI推理領域的突破性技術成果。消息指,該成果有望降低中國AI推理對HBM(高帶寬內存)技術的依賴,提升國產大模型推理性能,並完善本土AI推理生態的關鍵環節。
HBM是一種基於3D堆疊技術的先進DRAM解決方案,通過多層晶片垂直集成,顯著提升數據傳輸效率,兼具高帶寬、低延遲、高容量密度及高能效等優勢。由於AI推理需頻繁調用海量模型參數與實時輸入數據,HBM可讓GPU直接訪問完整模型,避免傳統DDR因帶寬不足導致算力閒置,對千億參數級大模型尤為重要。目前HBM在AI訓練領域滲透率接近100%,推理端也隨模型複雜化加速普及。
然而,HBM產能有限,加之美國出口限制,推動國內廠商探索Chiplet封裝、低參數模型優化等替代方案。《金融時報》10日引述知情人士報道,中國已要求美國在可能舉行的特朗普—習近平峰會前,放寬HBM晶片出口管制,作為雙邊貿易協議的一部分。
HBM對生成式AI開發至關重要,尤其在與GPU搭配時能加速處理龐大數據。目前輝達等美企是主要供應商。報道稱,北京擔憂HBM限制將削弱華為等企業研發AI晶片能力。歷屆美國政府均對華採取先進晶片出口限制,以遏制中國在AI與國防領域的發展。中國仍是全球最大半導體市場之一,也是美企重要收入來源。
美或放鬆HBM限制
《金融時報》指,美方對中國施壓已提高警覺,特朗普為促成峰會可能考慮放鬆限制。華府智庫戰略暨國際研究中心(CSIS)AI專家艾倫(Gregory Allen)表示,HBM價值佔先進AI晶片一半,放鬆管制等同幫助華為製造更強AI晶片,甚至取代輝達。
一名熟悉美國政府內部討論的人士稱,HBM出口管制是限制中國大規模生產AI晶片的「單一關鍵因素」。若放寬限制,將讓華為、中芯國際在一年內生產數百萬顆AI晶片,並分流原供美國市場的稀缺產能,這正是中國爭取、美方猶疑的焦點。另一知情人士指出,中國雖可能已獲得AI晶片運算核心,但缺乏HBM便無法組裝成完整產品,因此HBM成為最大瓶頸。
截至目前,白宮、美國國務院與中國外交部均未就此置評。外界關注,華為新技術能否部分化解HBM依賴,並在中美晶片博弈背景下,改變國產AI推理的發展路徑。 (編輯部)