2026年5月26日 星期二

趙坤茂/AI制霸考場的反思與契機

◆  蘇蘅/川普如何操弄他的媒體新歡
◆  方祖涵/泰德.透納那雙借來的釘鞋











趙坤茂/AI制霸考場的反思與契機

2026-05-26 00:00  聯合報/ 趙坤茂/台大資工系教授


四月下旬,日本 AI 企業 LifePrompt 宣布,他們使用 ChatGPT 挑戰今年東京大學和京都大學的入學考試,不僅全部合格,而且還超越人類考生榜首。從兩年前落榜到如今成為頂尖狀元驚人逆襲,再度為 AI 過人機智增添一筆傳奇。

東大考試滿分為五五○分,今年文科狀元得分四三四分、理科狀元則為四五三分;而 AI 在文科得分四五二分,在理科得分五○三分,雙雙超越考生狀元。此外,AI 京大法學部考試得分七七一分,超越考生狀元七三四分;在醫學部得分一,一七六分,也高於考生狀元一,○九八分。其實,早在今年一月,LifePrompt 就曾使用 ChatGPT-5.2 Thinking 版本,在「日本大學入學共通考試」中取得九門科目滿分,包括英文閱讀、國語(現代文)、數學一、數學二、物理、化學、世界史探究、日本史探究、資訊學。

回顧這兩年來,LifePrompt 在民國一一三年(二○二四年)使用 ChatGPT-4 挑戰東大入學考試,但未合格;民國一一四年(二○二五年)採用 o1 版本,首次超過合格線;今年使用 ChatGPT-5.2 Thinking,一舉擊敗人類狀元。試問古往今來的大規模測試中,曾有多少落榜生能在短短兩年內榮膺榜首呢?如此不可思議的大逆轉,除了詭譎多變選舉曾出現外,一時之間還真想不到其他例子。

放眼全球的標準化考試AI 制霸已比比皆是;例如美國大學的 SAT、一般研究所的 GRE、商學院的 GMAT 標準化考試AI 也都演進超級學霸。雖然 AI 仍未制霸台灣學測,但這可能是由於它缺乏台灣本土知識,以及缺少像 LifePrompt 這樣強而有力的「核心應用與測試者」,相信假以時日,AI 制霸學測亦非難事。

AI 在入學考試展現卓越應試能力時,傳統以「背誦與解題技巧」為核心篩選機制已然動搖。疫情期間,美國大學因 SAT 考場關閉而採用「自由選繳」政策,如今則走向兩極化;有些學校因擔憂招生品質下滑而恢復「強制要求」,另有一些學校則維持「自由選繳」或「完全不看」。

這其實面臨「父子騎驢」的兩難,強制要求會被抨擊受制於標準化考試的緊箍咒,並助長補習及剝奪弱勢機會;倘若放棄不看,則會過度依賴可能灌水的校內成績,再加上 AI 代寫氾濫,已讓學習履歷欠缺公信力,從而失去公平篩選客觀尺規

無論如何,AI 制霸考場的現象再次提醒大家,固然學習無帝王之路,但與其反覆以填鴨式教育增強學子和 AI 鬥智的能耐,倒不如培育每位學子具備自學精進基本學力,並在善用 AI 協作下,仍能保有靈活且嚴謹的批判性思考、別具特色的創新能力、典雅雋永美感體悟,以及明辨是非道德判斷

當前的 AI 仍無法理解人類的幽微情感,例如在日文小說文藝理解題中,它無法體會主角在妥協現實間「無法釋懷、點到為止」的複雜情感,反而過度解讀道德式自我反省,因而答錯。的確如此,倘若大家曾經使用 AI 談心,難免都會遭遇 AI 說「想太多」的反常回應

七十多年前,愛因斯坦曾將一個只接受專業知識訓練的人,比喻為一部有用的機器,或是一條訓練有素的狗,那人終將無法和諧發展。誠哉斯言!當訓練有素的機器人已具備超人專業知識,人類未來的出路,或許是回歸自然發光發熱生命本質