據《The Information》報道,OpenAI正在研發一款全新的生成式音樂工具,可根據文字或音訊提示詞自動生成音樂,未來有望為影片自動添加配樂,或在現有錄音中加入吉他、鋼琴等樂器聲軌。
報導引述消息人士指出,該工具目前仍處於研發階段,推出時間尚未確定。外界推測,OpenAI可能將其整合進ChatGPT或影片生成應用Sora中,而非作為獨立產品發行。
為提升音樂品質,OpenAI據稱正與美國茱莉亞音樂學院(Juilliard School)學生合作,透過標註樂譜與曲式資料提供訓練數據。這意味著模型不僅能理解旋律結構,也可掌握節奏與配器的專業細節。
據了解,OpenAI早期曾推出過音樂生成模型,但這些產品均早於ChatGPT發布。近年該公司將研發重心轉向文本轉語音(TTS)與語音轉文本(STT)的音頻模型,此次重返音樂生成領域,意味著其正擴大AI多媒體生態布局。
目前,Google與Suno等企業已推出成熟的AI音樂生成服務。業界分析認為,若OpenAI的音樂模型能與Sora影片生成工具結合,或將形成「AI影像+配樂」的一體化創作體驗,進一步推動生成式內容(AIGC)商業化。(編輯部)