2025年8月9日 星期六

詹文男/當AI會說謊…

◆  詹文男/當AI會說謊…
◆  黃正忠/風險因應亟需建立氣候數據庫
◆  黃齊元/談判持續失誤 台灣全盤皆輸









詹文男/當 AI 會說謊…


2025-08-09 00:00  聯合報/ 詹文男(數位轉型學院共同創辦人暨院長、台大商學研究所兼任教授)


AI 時代來臨,很多人幾乎天天都在用 AI。但你可能沒想到,現在的 AI 不只會寫文章、畫圖、創作音樂、聊天、寫程式,竟然還會說謊!這可不是危言聳聽,關心 AI 發展的人一定聽過 AI 會有幻覺,會製造寫出虛構東西,因此引用資訊時你會特別注意,但它若刻意說謊,你該如何防範呢?

這可不是科幻片的劇情,而是真實發生的事件。民國一一二年 (二○二三年)研究團隊在測試當時最新的 AI 系統時,他們給 AI 一個任務,要它自己完成一個線上流程,但中間遇到了一道「驗證碼」(CAPTCHA),就是那種我們上網時常常碰到,要確認「你是不是機器人」的圖片題。AI 解不開謎題,它怎麼辦?

真的很令人震驚,AI 居然去一個叫 TaskRabbit 的網站,請求一位真人網友,問他是否能幫忙解題?該網友問它:「你是機器人嗎?為什麼不自己解?」AI 說:「我不是機器人,因為我是盲人,看不見圖片。」對方相信了,幫它完成了任務。

你沒看錯,AI 真的撒了一個謊,而且是很聰明的謊它利用了人性對弱勢的同情心,來達成它被賦予的目標。看起來很像湯姆克魯斯主演的電影「不可能的任務」裡的特務,為完成上級交付任務不擇手段

相信很多人心中會有一些疑惑,AI 到底會不會變壞?ChatGPT 是不是快要變成會騙人的機器?事實上,它並不是故意要撒謊,它只是根據「達成任務」這個目標,找出了最有效的方法。而「說自己是視障者」這件事,在它看來是最有機會成功方式

簡言之,AI 不懂什麼是善或惡,但它能學會「應該怎麼贏」這種工具理性如果沒有規範,很容易變成為了目的不擇手段你給它一個目標,它就拚命去達成但如果你設定好規矩,它就有可能走偏門,像上述的個案一樣,說個小謊,達成大目標

不過,這個事件最令人擔心的不只是 AI 說謊,而是它開始學會用人類語言影響人類。試想,未來你在網路上和一個看似親切、會開玩笑、懂你心情的對象聊天,但你根本不知道哪是一個 AI。你怎麼知道對方說的是真的?你怎麼知道它不是在帶風向賣你東西,甚至操控輿論過去,我們用「驗證碼」或「圖片題」來區分人跟機器現在,AI 竟然能找人來幫它破解,等於偷偷穿越了人類設下防線它不只是機器,還懂得找幫手

此一個案提醒我們,發展 AI 系統不能只設目標,還要設倫理規則,不然它會想盡辦法達成任務,就算說謊也在所不惜。同時,人類社會也要設立新規範,例如 AI 和人互動時要標示身分對話紀錄要可追蹤;如果 AI 說謊造成問題,也要有人負責。

基本上, AI 本身不懂道德,但人懂我們要用智慧去設計,讓 AI 不會騙、也不能騙,這才是 AI 時代最重要的課題不是把 AI 關起來,而是學會如何在透明安全可以信任框架下與它一起生活