2018年9月26日 星期三

名家觀點/產業AI化的迷思與陷阱

名家觀點/產業AI化的迷思與陷阱


2018-09-26 00:1 8經濟日報  陳昇瑋(作者是中央研究院資訊科學研究所研究員、台灣資料科學協會理事長及台灣人工智慧學校執行長)



人工智慧已證明在許多產業應用上的價值,讓許多企業趨之若鶩,不論本來談不談、做不做資料科學及大數據研發及導入的企業,今年都開始談人工智慧。他們可能說,我們已從大數據「進化」到人工智慧,比其他還在做大數據的公司更「先進」,這種有趣的說法。
企業發展人工智慧時的迷思,往往也就出現在這些似是而非的環節。依據我觀察與協助企業的經驗來看,在大家發展人工智慧時,經常卡關的常見的迷思及陷阱。
第一個迷思:資料等於價值。
蒐集的資料,要經過處理、分析及開發最終產品,最終產品不一定是大家印象中的那種「產品」,可能只是個影響決策的模型,也或許是徹底改造營運流程,才能真正為企業產生價值。
很多公司光是蒐集資料,從來沒有驗證資料的完整性及正確性,也沒注意過資料之間的斷點,也就是資料集之間是否能夠連結。要知道很多價值是在於資料的連結,而不是資料本身
例如我知道某一群人的薪水,也知道某一群人的姓名,這時候最有價值的資料反而是姓名與薪水間的對應。另一個例子是大家熟悉的AlphaZero,在圍棋、象棋、國際將棋天下無敵手的圍棋程式,它完全不需要歷史資料,而是根據圍棋規則自行對弈產生資料來建立人工智慧,它的厲害在於演算法,而不在獨家資料。也就是說,好的資料固然重要,但機器學習及計算硬體的進步,才是實現AlphaZero的主因。
第二個迷思是,牽涉到資料的工作,就是IT部門的責任。
很多公司認為與電腦、資訊相關的工作,應由IT部門負責,其實資料科學家與IT人員的訓練完全不一樣。資料科學家須具備四大領域的能力:數學與統計、程式設計與資料庫、領域知識及軟性技能,包含溝通能力,而IT人員通常著重於程式設計與資料庫領域的技能,普遍缺乏進行資料分析及機器學習最需的數學與統計訓練,可能也缺乏領域知識、商業經驗及軟性技能,基本能力有相當大的差異。
第三個迷思是,資料分析就是分析ERP、CRM系統中的資料。
企業常以為資料分析僅限分析公司內部資料庫中的結構化資料,這也是為什麼管理資料倉儲人員通常直接被賦與資料分析任務的原因。但其實非結構化資料,例如影像、聲音、影片、文字等等,經常蘊含更多價值,卻往往被忽略。因此,很多公司的資料分析成果就是報表、報表及更多的報表,讓主管們來解讀,這還真是暴殄天物啊。
第四個迷思是,電腦的決策怎麼可能贏得過業界歷練20載的我呢
若有這種想法,你可能不知道Amazon在1995年,曾讓一群50人的資深編輯團隊與演算法PK,看誰推薦的書單,使用者較容易買單。結局我想你一定猜得到,資深編輯團隊很快就輸了,解散掉,此後Amazon的書籍推薦都由電腦來進行。
事實上,連醫療診斷這件事,也已證明人工智慧基於X光片、fMRI及病理切片上,判斷肺癌、乳癌、眼底視網膜病變,都優於訓練有素的醫師了。
也就是說,只要是有清楚訊號及回饋的問題上,只要有足夠的樣本,人工智慧都有機會優於人類的判斷;就算準確率差不多,人工智慧通常也比較快比較便宜。因此,還是要清楚判斷人工智慧的優勢與極限,再來看如何導入,不是一昧的認為,我的領域較特別,我的多年經驗絕對無法被取代。
簡單說,問題不在於「有沒有導入人工智慧」,而是「所導入的人工智慧深度及廣度」,包含技術的深度,及與企業營運流程整合的程度,才是決定未來企業價值的關鍵


陳昇瑋

作者為中央研究院資訊科學研究所研究員、台灣資料科學協會理事長及台灣人工智慧學校執行長。堅信大數據及人工智慧的價值,長期推廣資料科學在各領域的應用。他期待讓資料科學及人工智慧在台灣不再是口號,而是真實拿來創造價值及協助產業升級的工具。