今日,有超過四分之三的大型企業正在實施「數據渴求」型(data-hungry)的人工智慧行動方案,這些方案包括神經網路,或是根據大規模資料庫來接受訓練的深度學習系統。然而,組織裡最有價值的數據集當中,有很多都非常小:它們的單位是千位元組或百萬位元組,而不是艾位元組(exabyte,10的18次方位元組)。這些數據缺乏大數據的數量和速度,因此常會被忽略,在個人電腦和功能部門數據庫中閒置無用,也沒有連結到全公司的資訊科技創新行動方案。

但我們最近對醫學編碼人員進行的一項實驗證明,新興的人工智慧工具和技術,再配合仔細關注人為因素,能為使用小型數據來訓練人工智慧和改造各項流程,開創出新的可能。

以典型的大型組織來說,每一個用來驅動人工智慧或先進分析行動方案的大數據集(具有十億列和行),可能伴隨一千個未被使用的小數據集。這類例子很多:針對新顧客區隔的行銷調查,會議紀錄,少於一千列和行的電子表單。在我們的實驗中,未被使用的小數據集,是一個由醫療編碼人員團隊負責添加到病歷圖表裡的註解,數千個病歷圖表中,每一個圖表只有幾十個註解。

醫療編碼人員會分析個別病人的病歷圖表,並把有關診斷、療法、藥物等的複雜資訊,
已經是會員?立即登入
啟動您的「30 天成長計畫」
給自己一個月的時間,用知識升級大腦。
解鎖全站 50+「個人學習」主題與豐富的文章庫與影音內容。
首月 NT$60
次月起 $360/月,隨時可取消。
還沒準備好訂閱?註冊會員,每月可享 3 篇文章免費閱讀。
免費註冊