中國科技巨頭華為12日在「2025金融AI推理應用落地與發展論壇」上正式發表全新AI推理創新技術——UCM(推理記憶資料管理器),並計劃於9月正式開源,首發平台為魔擎社區,後續將逐步貢獻至業界主流推理引擎社區,並共享給所有採用「Share Everything」(共享架構)的儲存廠商與生態夥伴。
UCM是一款以KV Cache為核心的推理加速套件,融合多種類型的緩存加速演算法工具,能夠分級管理推理過程中產生的KV Cache記憶數據,進而擴大推理上下文窗口,提供高吞吐、低時延的推理體驗,並顯著降低每Token的推理成本。這一技術突破可直接優化使用者與AI互動時的體驗,包括降低回答延遲、提升答案準確性,以及加強複雜情境的推理能力。
華為強調,當前AI產業已從「追求模型能力極限」轉向「優化推理體驗」,而推理環節正是AI落地的「最後一公里」,其表現直接關係到用戶滿意度及商業可行性,已成為衡量模型價值的重要指標。
該技術已率先在中國銀聯三大智慧金融業務場景——「客戶之聲」、「行銷策劃」與「辦公室助理」中開展試點應用,並取得實際成果。華為表示,未來UCM有望推動AI在金融、醫療、教育等多個垂直行業的滲透與商業化進程。
催化AI應用端落地
業界分析認為,短期來看,UCM的發布將直接催化AI應用端的落地,利好金融IT與智慧醫療等應用類股。隨著AI推理需求快速增長,本土晶片企業如海光資訊在性價比與本土化適配方面的優勢將更加突出,業績成長潛力可望釋放。
中長期而言,政策推動的「AI+」行動、全球AIGC市場的高成長,以及AI應用對千行百業的效率重塑,將支撐相關企業的估值與業績持續提升。分析師建議投資人關注兩大類標的:「技術+場景」雙優勢企業,如完美世界(AI+遊戲)、春秋電子(AI+智慧汽車)、美格智能(AI+物聯網)等,已透過AI技術實現業績高速成長。基本面穩健且具補漲潛力的標的,如海光資訊(688041-CN)、中興通訊(AI+5G)、邁瑞醫療(AI+醫療)等,均有望受益於資金流入與行業增長。
分析指出,UCM的開源不僅有助於擴大業界合作與技術標準化,還將為AI推理生態提供更豐富的開發工具與性能優化方案,加速AI在多領域的應用落地,進一步提升中國在AI推理技術領域的競爭力。 (編輯部)