在1月17日至18日舉行的日本大學入學共通測試模擬實驗中,OpenAI最新人工智能模型GPT-5.2表現亮眼,在9個應試科目中取得滿分,整體得分率高達97%,成績明顯優於同場測試的Google Gemini 3 Flash(約91%),再度突顯AI在學術理解與解題能力上的快速進化。
是次實驗由AI新創公司Life Prompt與《日本經濟新聞》合作進行,題目涵蓋多個共通測試科目。測試過程中,試題由PDF檔透過光學字元辨識(OCR)轉換為Markdown格式,並結合圖像輸入,以貼近真實考試情境。結果顯示,GPT-5.2在公共與倫理等科目中取得滿分,地理科表現亦超過80%,惟在部分題目出現運算時間過長情況,反映其在處理高複雜度問題時仍存在限制。
作為對照,Gemini 3 Flash同樣在公共與倫理科取得滿分,但整體得分率不及GPT-5.2;Anthropic旗下Claude Sonnet 4.5亦展現一定實力,公共與倫理科得分達97分,但整體表現與其他模型仍有差距。
另一方面,日本實際舉行的共通測試中,新設的資訊科目共吸引約30萬5,104名考生報考,並有7人因違規被取消資格,官方平均分數將於1月21日公布。
相關測試結果再次引發教育界對AI角色的關注。隨着AI解題能力逼近甚至可能超越人類考生,未來大學入學考試的形式、公平性與評量方式,勢將面臨重新檢視與調整。(編輯部)