2020年7月19日 星期日

方祖涵/數字的真相與假象

名人堂電子報http://paper.udn.com/papers.php?pname=PID0030&page=1#ph

◆  方祖涵/數字的真相與假象
◆  楊志良/兩岸關係可以很簡單
◆  羅智成/牛角尖上胡思亂想
◆  薛琦/後疫時期的財金困境
◆  林中斌/川普恐土崩式敗選
◆  薛承泰/數你千遍也不厭倦(券)
◆  王正方/轉型正義的那個「正義」是什麼?

◆  王健壯/英系大法官會出現政治叛徒?
◆  周行一/男女志在四方
◆  洪蘭/找到志業 幸福人生
◆  陳亮恭/海藍色眼眸下的堅毅老人
◆  馬凱/新自由,多少惡假汝以行
◆  葉銀華/如何看待經營權爭奪之亂?
◆  黃介正/香港「恐懼的總和」

◆  嚴震生/毛小孩應可申報撫養親屬抵稅
◆  盛治仁/人生旅程 重要的是我們的言行
◆  方祖涵/轉型正義還是取消文化?
◆  李清志/池上歲月
◆  陳立恆/當天空不是極限,What is the Next?









方祖涵/數字的真相與假象


2020-07-18 23:28  聯合報 /   方祖涵(作者為運動文學作家)
美國總統川普(左二)在疫情期間一直抗拒戴口罩,十一日終於首度在公開場合戴口罩亮相。 (法新社)


廿年前剛開始職場生涯時,部門主管送給我一本書,叫做「如何用統計學說謊」。這本書是達瑞爾.霍夫在民國34年(一九五四年)寫的,主要在闡述運用統計經常出現的錯誤。因為它淺顯易懂,一度還成為美國大學統計學入門教科書,現在仍持續再版,並有多種語文翻譯。
送這本書除了開玩笑外,當然也有提醒意味,不管是無心之過還是刻意誤導,用數字說故事,有時反而讓真相被淹沒,對於從事資料分析工作的人,這類事情非常需要避免。
然而,在疫情蔓延當下,統計數字卻不時扮演弔詭角色。
最典型錯誤,是樣本來源造成誤差,像病毒剛開始由中國大陸傳到境外,歐美媒體曾經出現「年輕人感染率不知為何偏高」疑惑,其實單純是因韓國新天地教會群聚感染,不少信眾是大學生年紀緣故。另外也有獨立變數高度相關,讓溯源變得困難,比如東亞社會病毒擴散率遠低於世界其他地區,到底是牛痘疫苗、天生基因、生活習慣、珍珠奶茶,還是多用口罩帶來的結果呢?還記得咖哩可以防疫傳說嗎?
當然有心人刻意利用數字影響大眾,例子就更多。美國現在最大爭議之一,在於學校是否應該如期開學,川普政府認為年輕人染疫致死比例極低,開放效益遠高於風險,所以強烈推動重開。最近社群媒體出現一則貼文,「教育部長說兒童肺炎死亡率僅有○.○二%」「你知道嗎?那會是一萬四千個小孩」。問題是,其實她並沒有說過這個數字。
美國政府在經濟與防疫兩者間捉襟見肘,川普與支持者淡化疫情影響,甚至認為減少檢測就會減少確診,如此心態的確直接造成疫情持續擴散,可是相反方向誤導也不在少數。新冠肺炎全球蔓延後,從更多樣本導出致死率比原先猜測低很多,美國疾病管制局曾經將估計下修至○.二六%,是季節性流感兩倍多。儘管仍有專家對此初步數據表示懷疑,認為○.五%左右才是正確的,然而大眾恐懼早超出相對比例。在「只是尋常感冒」跟「像SARS一樣恐怖」間,媒體跟政客一如往常用本身利益決定訊息方向,於是疫情嚴重性,同時被高估與低估。
民主黨維吉尼亞州政府浮報檢測數、共和黨佛羅里達州政府檢測無症狀遊民降低確診比例、川普政府在死亡高峰出現前宣揚醫療成果,各種統計名目令人眼花撩亂地出現,不知道數字是在說故事還是在說謊。科技進步讓互動圖表變得清晰易懂,大數據分析讓趨勢從此難以遁形,可是,真相真的因此清晰了嗎?
對了,前面說到達瑞爾.霍夫,儘管寫了一本諄諄教誨的暢銷工具書,可是那本書出版不到十年,他就從菸草公司拿錢著手撰寫續集,想用數字駁斥香菸對人類健康有害的「謬論」。
說真的,不管在哪一個時代,每個人都只能自己小心謹慎,別被統計學騙了。