釋放AI的「創造力」，它能自學找出解方

Why AI That Teaches Itself to Achieve a Goal Is the Next Big Thing

、

2021/12/26

oxygen/Getty Images

競賽類的AI，和大多數公司用來進行預測AI，兩者有什麼區別？前者有創造能力。這種AI使用了「強化學習」，並不是靠餵歷史數據，來分析未來的變數；而是透過反覆試驗和錯誤來自我學習，擅長將某些會隨著時間流逝而改變優先執行順序的任務，來進行優化。那麼，領導人該怎麼去運用這種「更聰明」的AI，讓他們「發揮創造力」，幫你找出最佳解決方案？

(不符合) 小於6段 & 小於700字 (段落: 1/ 字數: 1197)

圍棋的世界級棋王李世乭（Lee Sedol），在著名的2016年「人機大戰」第二局比賽中，很不理解Deepmind開發的AlphaGo軟體所下的第37步棋，結果花了將近15分鐘才落子。其他經驗豐富的棋手，也沒見過那一步棋的下法，有位評論員表示機器犯了錯誤。其實那是一個經典的例子，顯示人工智慧（artificial intelligence，AI）演算法似乎不只能在數據中辨識型態，還能學習具有策略、甚至具有創意的事物。確實，Deepmind的開發人員除了把圍棋棋王過去的下棋實例輸入演算法裡，還訓練AlphaGo自己和自己對弈數百萬場。這套系統在與自己的對弈中，有機會探索新的棋路和策略，然後評估這些表現是否有改善。透過所有這些反覆試驗和錯誤，AlphaGo發現了一種新棋路，連世界一流好手也感到意外。

如果這種具備創意能力的AI，跟不同於大多數企業在應用機器學習時，最後會使用的聊天機器人和預測模型不一樣，那是因為，它們真的不同。AlphaGo之類的競賽系統，不是用歷史數據去產出預測的機器學習，而是使用「強化學習」（re...

已經是會員？立即登入

啟動您的「30 天成長計畫」

給自己一個月的時間，用知識升級大腦。

解鎖全站 50+「個人學習」主題與豐富的文章庫與影音內容。

首月 NT$60

次月起 $360/月，隨時可取消。

還沒準備好訂閱？註冊會員，每月可享 3 篇文章免費閱讀。

免費註冊

凱瑟琳．休姆 Kathryn Hume

加拿大皇家銀行（Royal Bank of Canada）機器學習研究實驗室Borealis AI的暫代主管。休姆博士加入Borealis之前，曾在Integrate.ai和Fast Forward Labs擔任領導職務，協助《財星》五百大企業中的五十多家開發和實施人工智慧計畫。她曾任教於哈佛大學、麻省理工學院（MIT）、多倫多大學（University of Toronto）和卡加利大學（University of Calgary）的商學院和法學院，教授數位轉型和法律倫理的課程。

馬修．泰勒 Matthew E. Taylor

加拿大亞伯塔大學（University of Alberta）計算機科學副教授，並擔任智慧型機器人學習實驗室（Intelligent Robot Learning Lab）負責人，也是亞伯機器智慧研究所（Alberta Machine Intelligence Institute）研究員和駐院研究員。他目前的研究興趣包括：強化學習的根本改善、將強化學習應用於真實世界的問題，以及人類與人工智慧之間的互動。他即將出版新書《現實世界資料的強化學習應用》（Reinforcement Learning Applications for Real-World Data），目標讀者是沒有機器學習學位的實務工作者。