微軟(Microsoft)正加速推進人工智能戰略轉型,從過往依賴外部合作夥伴,轉向建立自研前沿模型體系,目標在未來數年內打造可與OpenAI及Anthropic競爭的頂級AI平台。
據彭博社報道,微軟AI業務負責人穆斯塔法·蘇萊曼(Mustafa Suleyman)近日表示,公司計劃在2027年前實現「前線模型」目標,使自研系統在文本、圖像與音頻等多模態能力上達到行業最先進水平。微軟首席執行官薩提亞·納德拉亦在內部會議中強調,未來三至五年實現AI能力自主化,將成為公司核心戰略。
此舉標誌著微軟在AI領域的重要轉向。過去,微軟在通用大模型開發上長期依賴與OpenAI的合作,並累計投資超過130億美元。不過,在去年雙方合作協議調整後,微軟獲得更大自主權,為其發展自研模型掃除制度障礙。
推租新錄音轉錄模型
作為最新進展,微軟於4月2日推出語音轉錄模型MAI-Transcribe-1,為其MAI系列第三款模型。該模型在涵蓋25種語言的FLEURS基準測試中,平均字錯誤率僅3.9%,並在其中11種語言測試中排名第一。對比競品,其在多數語言表現優於OpenAI的Whisper-large-v3及Google的Gemini 3.1 Flash。
除準確度外,MAI-Transcribe-1亦強調效率與成本優勢。其批量轉錄速度可達微軟Azure Fast服務的2.5倍,每小時成本約0.36美元,被視為目前主流雲服務中具競爭力的解決方案。該模型已於Microsoft Foundry平台開放使用,未來將逐步整合至Teams等產品。不過,現階段仍未支援即時轉錄、說話人分離等進階功能,相關能力預計在後續版本中推出。
在基礎設施方面,微軟正大幅擴張算力投入。公司已部署英偉達GB200晶片集群,並計劃在未來12至18個月內將運算能力提升至前沿水平,以支撐多模態模型的訓練與推理需求。
同時,微軟內部亦進行組織調整,蘇萊曼將專注於模型研發,而Copilot業務則由前Snap高管雅各布·安德魯負責,反映公司正加快AI產品與底層技術的分工發展。
儘管微軟持續強化自研能力,公司仍表示將維持對外部模型生態的支持。但隨著自研模型逐步成熟,市場普遍認為,微軟未來對OpenAI的依賴程度將顯著下降。
微軟正透過模型、自主算力與組織重整三管齊下,加速構建完整AI技術體系。在全球AI競爭日益激烈背景下,其能否在未來數年內打造具備領先能力的通用模型,將成為決定其科技版圖的重要關鍵。 (編輯部)