據哈佛醫學院與貝斯以色列女執事醫療中心最新研究顯示,OpenAI一款推理模型在真實臨床案例測試中,於診斷與治療決策表現已達人類醫生水平,部分情況甚至更優,顯示AI正進入醫學中最複雜的「不完整資訊決策」領域。
該研究刊登於《科學》期刊,重點不在傳統標準化測試,而是模擬急診與住院場景中資訊不完整、持續變化的真實情境。模型在每一步僅能使用當下可獲得的病歷資料進行判斷。
在一宗肺栓塞病例中,醫生初步判斷病情惡化與用藥無效有關,但AI模型透過電子病歷推測患者可能有狼瘡病史,後續證實其方向正確。整體測試結果顯示,在相同資訊限制下,模型表現優於兩名資深醫生,並在《新英格蘭醫學雜誌》病例等高難度診斷測試中同樣領先。
不過研究亦指出,模型目前僅依賴文字資料,未整合影像、聲音等臨床關鍵訊息,仍存在應用限制。研究團隊強調,AI並非取代醫生,而是有望成為臨床決策輔助工具,特別適用於急診等高壓環境。未來關鍵在於透過嚴謹臨床試驗,驗證其是否能真正改善患者治療結果。(編輯部)