
以更快的速度,建立簡單的模型。
現在,企業不斷產生大量的數據資料,但那不一定可以轉化成可操作的資訊。在過去幾年裡,我和我在麻省理工學院(MIT)的研究小組,一直在尋找一個根本問題的答案:企業如何透過機器學習,來發揮資料儲存庫的完整潛力?
我們與各種產業的伙伴合作,設計以機器學習為主的解決方案,過程中很驚訝地發現,這個問題的現有答案通常不適用。為什麼?
首先,我們與機器學習專家談論他們工作中最困難的部分時,這些專注於訓練和測試預測模型的資料科學家都一再表示,「資料很混亂。」起初,我們按字面理解這句話,以為是指資料眾所周知的問題:缺少價值,或是資料庫之間缺乏一致性。但當我們更進一步探究,就了解到這個問題有些不同。以最原始形式存在的資料,即使是正確無誤的資料,乍看之下仍太過龐大和複雜,連專家都很難理解。它有太多表格和欄位,而且通常是根據極高的細微度(granularity)來收集;例如,線上點擊流每次點擊都會產生新資料,而感測器收集每秒觀察125次的資料。機器學習專家一向使用已匯集成一些有用變數的資料,例如使用者的網站訪問次數,而不是呈現使用者在網站上採取的每項行動的表格。
同時,我們經常聽到業務專家抱怨「我們有很多資料,卻沒有
我們與各種產業的伙伴合作,設計以機器學習為主的解決方案,過程中很驚訝地發現,這個問題的現有答案通常不適用。為什麼?
首先,我們與機器學習專家談論他們工作中最困難的部分時,這些專注於訓練和測試預測模型的資料科學家都一再表示,「資料很混亂。」起初,我們按字面理解這句話,以為是指資料眾所周知的問題:缺少價值,或是資料庫之間缺乏一致性。但當我們更進一步探究,就了解到這個問題有些不同。以最原始形式存在的資料,即使是正確無誤的資料,乍看之下仍太過龐大和複雜,連專家都很難理解。它有太多表格和欄位,而且通常是根據極高的細微度(granularity)來收集;例如,線上點擊流每次點擊都會產生新資料,而感測器收集每秒觀察125次的資料。機器學習專家一向使用已匯集成一些有用變數的資料,例如使用者的網站訪問次數,而不是呈現使用者在網站上採取的每項行動的表格。
同時,我們經常聽到業務專家抱怨「我們有很多資料,卻沒有
已經是會員?立即登入
閱讀完本模組的文章/個案後
我們建議您思考下列問題
Q.
什麼是數位轉型的真實意義?
Q.
你是否已盤點組織數字化、數位化與數位轉型的目標與能耐。
Q.
如何運用企業智慧決策分析學找出組織明確的發展盲點與機會點?
Q.
如何培養組織與時俱進的頂尖員工?
Q.
如何擬定組織的數位轉型策略?
Q.
如何讓組織數位轉型策略落地?
Q.
如何制定推動「分析成性,公私兩利」組織文化的戰術?
Q.
什麼是「轉識成智」?如何協助組織轉識成智進而推動智慧決策?
更多關聯主題
更多關聯主題





