OpenAI執行長山姆‧奧特曼(Sam Altman)近日在播客節目《Mostly Human》中談及ChatGPT語音模型的能力限制,一段看似簡單的「計時功能」意外成為焦點,凸顯當前生成式AI在時間處理上的短板。
事件起因於一段在TikTok上瘋傳的影片。影片中,用戶要求ChatGPT替其跑一英里計時,但系統最終給出的時間並非實際追蹤結果,而是憑空生成的數值。該影片迅速引發討論,也在節目中被主持人提及。奧特曼回應時坦言,這是「已知問題」,並表示目前ChatGPT語音模型尚未具備真正啟動計時器或準確掌握時間流逝的能力。
他指出,OpenAI正計劃為語音模型加入更多「智能能力」,但相關功能的完善仍需時間,預計至少還需約一年才能顯著改善。
這一案例也反映出生成式AI在時間與數字處理上的普遍局限。無論是文字模型難以準確判斷對話持續時間,還是圖像生成模型經常在時鐘刻度或指針位置上出錯,「時間」始終是多數AI系統較難處理的領域之一。
值得注意的是,事件後續發展更具戲劇性。原影片創作者在看到奧特曼的回應後,再次向ChatGPT詢問相關問題。模型雖一度堅稱自身具備時間處理能力,但在實際要求進行跑步計時時,仍給出看似合理卻未經驗證的時間結果,再次暴露其局限。
在日常應用中,ChatGPT已被廣泛視為高效的數位助手,涵蓋寫作、程式設計及客服等場景。然而,當用戶詢問「現在幾點?」等基本問題時,系統往往無法提供準確答案,甚至直接回應無法存取裝置的即時時鐘或地理位置,相關現象亦在社群平台引發討論。
AI專家Yervant Kulbashian指出,生成式AI的設計初衷並非處理即時資訊。這類模型主要依賴預先訓練的數據生成回應,並未持續連接外部資料來源,例如系統時鐘或網路時間協定(NTP)。因此,在缺乏即時數據的情況下,模型難以提供準確的時間資訊。
不過,在特定條件下,ChatGPT仍可能給出正確時間。例如當用戶啟用搜尋功能或外部工具時,系統可透過瀏覽器API或其他接口讀取裝置時間。但這類操作需額外授權,且可能占用模型的上下文資源,影響整體運算表現。
此外,AI在處理時間相關的視覺任務時亦存在困難。例如在辨識模擬時鐘圖像時,模型常無法準確判讀時針與分針位置,進一步影響其在教育、工具應用等場景的可靠性。
OpenAI方面表示,正持續優化ChatGPT在時間識別與相關功能上的表現,未來將透過模型升級與功能整合,提升其在日常應用中的準確度與實用性。(編輯部)