(不符合) 小於6段 & 小於700字 (段落: 1/ 字數: 1197)

圍棋的世界級棋王李世乭(Lee Sedol),在著名的2016年「人機大戰」第二局比賽中,很不理解Deepmind開發的AlphaGo軟體所下的第37步棋,結果花了將近15分鐘才落子。其他經驗豐富的棋手,也沒見過那一步棋的下法,有位評論員表示機器犯了錯誤。其實那是一個經典的例子,顯示人工智慧(artificial intelligence,AI)演算法似乎不只能在數據中辨識型態,還能學習具有策略、甚至具有創意的事物。確實,Deepmind的開發人員除了把圍棋棋王過去的下棋實例輸入演算法裡,還訓練AlphaGo自己和自己對弈數百萬場。這套系統在與自己的對弈中,有機會探索新的棋路和策略,然後評估這些表現是否有改善。透過所有這些反覆試驗和錯誤,AlphaGo發現了一種新棋路,連世界一流好手也感到意外。

如果這種具備創意能力的AI,跟不同於大多數企業在應用機器學習時,最後會使用的聊天機器人和預測模型不一樣,那是因為,它們真的不同。AlphaGo之類的競賽系統,不是用歷史數據去產出預測的機器學習,而是使用「強化學習」(re...

已經是會員?立即登入
繼續閱讀全文
免費註冊會員帳號
可享每月三篇文章免費讀
註冊免費會員
訂閱數位版
訂閱數位版即可立即無限暢讀全站優質文章、影音等豐富內容
首月 / NT$60
每月定期扣款,隨時可線上申請暫停扣款