2026年5月26日星期二

趙坤茂／AI制霸考場的反思與契機

◆ 　蘇蘅／川普如何操弄他的媒體新歡

◆ 　方祖涵／泰德．透納那雙借來的釘鞋

趙坤茂／AI制霸考場的反思與契機

2026-05-26 00:00 　聯合報／ 趙坤茂／台大資工系教授

四月下旬，日本 AI 企業 LifePrompt 宣布，他們使用 ChatGPT 挑戰今年東京大學和京都大學的入學考試，不僅全部合格，而且還超越人類考生榜首。從兩年前落榜到如今成為頂尖狀元的驚人逆襲，再度為 AI 過人的機智增添一筆傳奇。

東大考試滿分為五五○分，今年文科狀元得分四三四分、理科狀元則為四五三分；而 AI 在文科得分四五二分，在理科得分五○三分，雙雙超越考生狀元。此外，AI 在京大法學部考試得分七七一分，超越考生狀元七三四分；在醫學部得分一,一七六分，也高於考生狀元一,○九八分。其實，早在今年一月，LifePrompt 就曾使用 ChatGPT-5.2 Thinking 版本，在「日本大學入學共通考試」中取得九門科目滿分，包括英文閱讀、國語（現代文）、數學一、數學二、物理、化學、世界史探究、日本史探究、資訊學。

回顧這兩年來，LifePrompt 在民國一一三年（二○二四年）使用 ChatGPT-4 挑戰東大入學考試，但未合格；民國一一四年（二○二五年）採用 o1 版本，首次超過合格線；今年使用 ChatGPT-5.2 Thinking，一舉擊敗人類狀元。試問古往今來的大規模測試中，曾有多少落榜生能在短短兩年內榮膺榜首呢？如此不可思議的大逆轉，除了詭譎多變的選舉曾出現外，一時之間還真想不到其他例子。

放眼全球的標準化考試，AI 制霸已比比皆是；例如美國大學的 SAT、一般研究所的 GRE、商學院的 GMAT 等標準化考試，AI 也都演進為超級學霸。雖然 AI 仍未制霸台灣學測，但這可能是由於它缺乏台灣本土知識，以及缺少像 LifePrompt 這樣強而有力的「核心應用與測試者」，相信假以時日，AI 制霸學測亦非難事。

當 AI 在入學考試展現卓越應試能力時，傳統以「背誦與解題技巧」為核心的篩選機制已然動搖。疫情期間，美國大學因 SAT 考場關閉而採用「自由選繳」政策，如今則走向兩極化；有些學校因擔憂招生品質下滑而恢復「強制要求」，另有一些學校則維持「自由選繳」或「完全不看」。

這其實面臨「父子騎驢」的兩難，強制要求會被抨擊受制於標準化考試的緊箍咒，並助長補習及剝奪弱勢機會；倘若放棄不看，則會過度依賴可能灌水的校內成績，再加上 AI 代寫氾濫，已讓學習履歷欠缺公信力，從而失去公平篩選的客觀尺規。

無論如何，AI 制霸考場的現象再次提醒大家，固然學習無帝王之路，但與其反覆以填鴨式教育增強學子和 AI 鬥智的能耐，倒不如培育每位學子具備自學精進的基本學力，並在善用 AI 協作下，仍能保有靈活且嚴謹的批判性思考、別具特色的創新能力、典雅雋永的美感體悟，以及明辨是非的道德判斷。

當前的 AI 仍無法理解人類的幽微情感，例如在日文小說文藝理解題中，它無法體會主角在妥協與現實間「無法釋懷、點到為止」的複雜情感，反而過度解讀成道德式的自我反省，因而答錯。的確如此，倘若大家曾經使用 AI 談心，難免都會遭遇 AI 說「想太多」的反常回應。

七十多年前，愛因斯坦曾將一個只接受專業知識訓練的人，比喻為一部有用的機器，或是一條訓練有素的狗，那人終將無法和諧發展。誠哉斯言！當訓練有素的機器人已具備超人的專業知識，人類未來的出路，或許是回歸自然發光發熱的生命本質。

2026年5月26日 星期二