小數據在人工智慧裡的大角色 | 哈佛商業評論・與世界一流管理接軌

今日，有超過四分之三的大型企業正在實施「數據渴求」型（data-hungry）的人工智慧行動方案，這些方案包括神經網路，或是根據大規模資料庫來接受訓練的深度學習系統。然而，組織裡最有價值的數據集當中，有很多都非常小：它們的單位是千位元組或百萬位元組，而不是艾位元組（exabyte，10的18次方位元組）。這些數據缺乏大數據的數量和速度，因此常會被忽略，在個人電腦和功能部門數據庫中閒置無用，也沒有連結到全公司的資訊科技創新行動方案。

但我們最近對醫學編碼人員進行的一項實驗證明，新興的人工智慧工具和技術，再配合仔細關注人為因素，能為使用小型數據來訓練人工智慧和改造各項流程，開創出新的可能。

以典型的大型組織來說，每一個用來驅動人工智慧或先進分析行動方案的大數據集（具有十億列和行），可能伴隨一千個未被使用的小數據集。這類例子很多：針對新顧客區隔的行銷調查，會議紀錄，少於一千列和行的電子表單。在我們的實驗中，未被使用的小數據集，是一個由醫療編碼人員團隊負責添加到病歷圖表裡的註解，數千個病歷圖表中，每一個圖表只有幾十個註解。

醫療編碼人員會分析個別病人的病歷圖表，並把有關診斷、療法、藥物等的複雜資訊，

已經是會員？立即登入

啟動您的「30 天成長計畫」

給自己一個月的時間，用知識升級大腦。

解鎖全站 50+「個人學習」主題與豐富的文章庫與影音內容。

首月 NT$60

次月起 $360/月，隨時可取消。

還沒準備好訂閱？註冊會員，每月可享 3 篇文章免費閱讀。

免費註冊