今日,有超過四分之三的大型企業正在實施「數據渴求」型(data-hungry)的人工智慧行動方案,這些方案包括神經網路,或是根據大規模資料庫來接受訓練的深度學習系統。然而,組織裡最有價值的數據集當中,有很多都非常小:它們的單位是千位元組或百萬位元組,而不是艾位元組(exabyte,10的18次方位元組)。這些數據缺乏大數據的數量和速度,因此常會被忽略,在個人電腦和功能部門數據庫中閒置無用,也沒有連結到全公司的資訊科技創新行動方案。

但我們最近對醫學編碼人員進行的一項實驗證明,新興的人工智慧工具和技術,再配合仔細關注人為因素,能為使用小型數據來訓練人工智慧和改造各項流程,開創出新的可能。

以典型的大型組織來說,每一個用來驅動人工智慧或先進分析行動方案的大數據集(具有十億列和行),可能伴隨一千個未被使用的小數據集。這類例子很多:針對新顧客區隔的行銷調查,會議紀錄,少於一千列和行的電子表單。在我們的實驗中,未被使用的小數據集,是一個由醫療編碼人員團隊負責添加到病歷圖表裡的註解,數千個病歷圖表中,每一個圖表只有幾十個註解。

醫療編碼人員會分析個別病人的病歷圖表,並把有關診斷、療法、藥物等的複雜資訊,
已經是會員?立即登入
繼續閱讀全文
免費註冊會員帳號
可享每月三篇文章免費讀
註冊免費會員
訂閱數位版
訂閱數位版即可立即無限暢讀全站優質文章、影音等豐富內容
首月 / NT$60
每月定期扣款,隨時可線上申請暫停扣款